miércoles, marzo 29, 2006


Si. Aqui está...La primavera!!

cabos sueltos...

releyendo he visto que habia algo que no había contestado...
Solución: la cerilla.

lunes, marzo 27, 2006

piénsalo...es tu responsabilidad...

¿El discurso electrónico se asemeja al discurso oral?
¿Existe un "discurso electrónico" general en Internet?
¿El discurso en el correo electrónico es igual que en los chats?
¿Hay factores extralingüísticos que den lugar a distintos tipos de discurso en los mensajes de correo electrónico? ¿Y en los chats?
¿Cambia en algo el discurso cuando se utiliza el correo electrónico para practicar una lengua extranjera?
¿Qué ocurre con las variedades de una lengua? ¿Qué consecuencias puede tener el acceso fácil y rápido a Webs procedentes de distintas zonas dialectales? ¿Y si el que accede a esas Webs es un aprendiz (no nativo) de la lengua?
¿Y la terminología para hablar de Internet? ¿La adoptamos del inglés? ¿La adaptamos? ¿La reinventamos? ¿Existe una norma clara al respecto?
;)

viernes, marzo 24, 2006

Las próximas clases...

Hoy hemos terminado con nuestro lenguaje máquina. Hemos obtenido algunas conclusiones del proceso y vamos a terminarlo aquí, ya que creo que no íbamos a avanzar mucho más.

En cualquier caso creo que la reflexión ha sido positiva y necesaria.

La próxima semana empezaremos con el proyecto plankton,algo más concreto, más descriptivo y mucho más compuatcional. Espero que os sea de más utilidad.

saludos y buen finde


Eduardo

viernes, marzo 17, 2006

Las cinco vocales y Lucía Echevarría (Off topic)

Las 5 vocales

Carta dirigida a la escritora Lucía Echevarría. La famosa escritora dijo en una entrevista, que "murciélago" era la única palabra en el idioma español-castellano, que contenía las 5 vocales y D. José Fernando Blanco Sánchez, envió esta carta a un periódico para ampliar su conocimiento.

Carta al director en un diario nacional... Hace pocos días.


"Acabo de ver en la televisión estatal a Lucía Echevarría diciendo que 'murciélago' es la única palabra en nuestro idioma que tiene las cinco vocales.

¡Confiturera, frene la euforia!. Un arquitecto escuálido llamado Aurelio (o Eulalio... O Ausencio) dice que lo más auténtico es tener un abuelito que lleve un traje reticulado y siga el arquetipo de aquél viejo reumático, desahuciado y repudiado, que consiguiera en su tiempo ser esquilado por un comunicante que cometió adulterio con una encubridora cerca del estanquillo (sin usar estimulador).

Señora escritora: si el peliagudo enunciado de la ecuación la deja irresoluta, olvide su menstruación y piense de modo jerárquico. No se atragante con esta perturbación, que no va con su milonguera y meticulosa educación, y repita conmigo, como diría Cantinflas: ¡Lo que es la falta de ignorancia!"



Fdo. José Fernando Blanco Sánchez.

jueves, marzo 16, 2006

La Traducción Automática: enfoques y métodos

presentado por Leonardo Campillos

1.-Introducción

La traducción automática se emplea como ayuda a los traductores, normalmente centrados en áreas concretas, manuales técnicos, textos legales...

No resultan útiles en textos literarios, ensayos, etc, ya que no se puede "traducir" la creatividad del autor.

Se emplean en organizaciones internacionales, Unión Europea(SYSTRAN) y otros.

Normalmente los textos traducidos requieren un apoyo del traductor, tanto antes como después
  • Preedición: Simplificando el lenguaje de entrada para evitar estructuras complejas o vocabulario que pueda llevar a confución. Se puede utilizar también un lenguaje de control para poner marcas al traductor.
  • Postedición: Revisando las construcciones y el vocabulario y eliminando las marcas del lenguaje de control.

Es especialmente efectiva en áreas que emplean un lenguaje especializado o un sublenguaje.

2.-Traducción de textos

Tipos:
  • Traducción basada en reglas:(Rule Based Machine Translation, RBMT)
  1. Traducción directa
  2. Transferencia
  3. Interlengua:Esperanto o Traducción basada en el conocimiento (Knowledge Based Machine Traslation,KBMT)
  • Traducción basada en Analogías(Analogy Based Machine Translation ABMT)
  1. Corpus Paralelo y aplicaciones derivadas
  2. Traducción automática basada en ejemplos: basada en glosario, patrones...
  3. Métodos estadísticos
  • Métodos mixtos
  1. Sistemas multimotores
  2. Traducción híbrida
3.-Traducción del habla

Están bastante poco desarrollados

4.-Ejemplo de la traducción automática en la web

Traducción automática en Internet y en chats.
Los principales problemas vienen del uso de lenguaje coloquial

5.-Aplicaciones futuras de la traducción automática

Subtítulos de palículas
Traducción de frases predefinidas
...

6.-Lenguas cubiertas por la traducción automática

Los Europeos son los más tratados, excepto las lenguas escandinavas, griego, húngaro,rumano...

Hay problemas con las fuentes tipográficas.

martes, marzo 14, 2006

Más sobre lenguajes inventados

Está muy interesante la información sobre lenguajes creados por aficionados. Creo que es una manera estupenda de aprender sobre el lenguaje...

Aquí hay información general

Y aquí un listado de lenguajes artificiales

¿Alguien se anima a crear uno?

Eduardo
PD: Hojeando uno encuentra cosas como esta: El Aingelja

Sabríais hacer esto??


Colocar los números impares del 1 al 31, ambos inclusive, y los números 20,32,34,38 y 40 en los 20 vértices de los 4 pentágonos y en el centro de la tela de araña, de manera que la suma de los 5 números de los vértices de cualquier pentágono sea igual a la suma de los cinco números de cualquier radio e igual a 100.

domingo, marzo 12, 2006

Exposición sobre la traducción automática

Hola

El jueves o el viernes expondré en clase el trabajo sobre "La traducción automática: enfoques y métodos”, en el que trataré los siguientes puntos:

1 – Traducción de textos

1.1 – Traducción automática basada en reglas (Ruled Based Machine Translation, RBMT)

1.1.1 – Métodos basados en la traducción directa

1.1.2 – Métodos basados en la transferencia

1.1.3 – Métodos basados en la interlengua

1.2 – Traducción automática basada en analogías (Analogy Based Machine Translation, ABMT)

1.2.1 - Traducción automática basada en ejemplos (Example Based Machine Translation, EBMT)

1.2.2 - Traducción automática estadística

1.2.3 – La resolución de la anáfora

2 – Traducción automática del lenguaje hablado

3- Lenguas cubiertas por la traducción automática

4- Empleo de la traducción automática en la web

5 - Aplicaciones futuras de la traducción automática


Si alquien está interesado en leer previamente el trabajo, pedídmelo sin problemas y os lo mando.


Un saludo, nos vemos en clase.

viernes, marzo 10, 2006

El Verdurio

Otro lenguaje inventado, en este caso el Verdurio... su gramática... Incluso se ha creado un pais...

Y a partir de ahí... el Kebreni...

Todo esto que parece una broma, al menos a mí me resulta bastante divertido, nos pueda llevar a una reflexión sobre el origen de los lenguajes...

El klingonés (Klingon Language)

Cuando algunos tratan de unificar las lenguas del mundo y mantener una única lengua común, otros crean lenguajes artificiales, en este caso para la película Stark Trek y a partir de ahí surge una comunidad enorme de hablantes, una academia de la lengua, hablantes nativos,...

¿Quizá el lenguaje también sirva para identificarnos con un grupo?
¿Para diferenciarnos de otros?
¿Qué sentido tiene esto?

Enlaces de interés
Información sobre el lenguaje
Su instituto de la Lengua
Tiene una wikipedia con 65 artículos
Google tiene una página para búsquedas en klingonés!
Una Radio Alemana, Deustche Welle, ha creado un servicio en Klingonés
Y aquí un artículo de la BBC sobre el mismo...
Hay 7 veces más hablantes de klingonés que de navajo....

Kits de construcción de lenguajes

Cómo crear un lenguaje, adaptado de Language Construction Kit de Mark Rosenfelder:
http://pueblacity.com/ego-pdf/sp/lng/como/index.html

Language Construction Kit de Mark Rosenfelder: www.zompist.com/kit.html

jueves, marzo 09, 2006

Sobre software libre

Hay que explicar la diferencia entre los distintos tipos de programas informáticos, algunos de los cuales pueden ser gratuitos o no, o ser de muestra o con todas o sólo algunas de las funcionalidades:

·Programa clippleware: versión que se puede utilizar con algunas funciones bloqueadas; generalmente es una muestra comercial. Por ejemplo, Trados Translator´s Workbench 7.

·Programa shareware: herramienta que el usuario puede probar y que está sujeta a un periodo temporal o a un límite de uso. Pasada esta fecha hay que pagar una licencia para continuar utilizando este programa. Un ejemplo es el programa de compresión de archivos WinZip.

·Programa de código fuente abierto: programa cuyo código fuente es accesible y puede ser modificado y mejorado, pero siempre de forma que las nuevas versiones sean también accesibles y el código fuente quede abierto. Debe ser aprobado por la Open Source Initiative (OSI, www.opensource.org). No es necesariamente gratuito, puede venderse, como Red Hat de Linux.

·Programa de libre distribución o freeware: programa en el que el creador retiene sus derechos de autor y el código fuente no es accesible. No se suele permitir un uso comercial del mismo, sino que está disponible gratuitamente. Por ejemplo, Transit TE Satellite o Adobe Acrobat Reader.

·Programas de dominio público: el creador no posee derechos de autor sobre los mismos, pero el código fuente no suele ser abierto.

·Software libre (Free Software): programa de libre uso y distribución cuyo código fuente es abierto para que el usuario pueda mejorar el programa (y compartirlo con otros) o adaptarlo a sus propias necesidades. Funcionan en el sistema operativo y gratuito GNU-Linux (aunque algunos también son compatibles con Windows) y debe ser aprobado por la FSF (Free Software Foundation), es decir, poseer la licencia GNU GPL (General Public Licence). Aunque muchos de los programas son gratuitos, la condición de software libre no es incompatible con la de pagar por estos programas, pues si se quiere tener asistencia técnica es necesario comprar una licencia. Tal hecho sucede con el entorno de productos OpenOffice (www.openoffice.org), gratuito y de código fuente abierto, contrapartida del paquete Office de Microsoft, que es el mismo producto que el entorno StarOffice de Sun Microsystems.

Algunos enlaces sobre software libre*

*Tomados de "El software libre al microscopio", J. M. González-Barahona y S. Koch, Novática. Revista de la asociación de técnicos de informática, nº 175, mayo-junio 2005, año XXXI.


Libro Blanco del software libre en España: informe realizado por equipos de especialistas para educar al futuro usuario del sofware libre. www.libroblanco.com

Asociacion de usuarios españoles de GNU/LiNUX.: asociacion sin animo de lucro, fundada en 1997, que tiene como objetivo la defensa y promoción del Software Libre. http://hispalinux.es

Slashdot: gestor de noticias sobre tecnología y ordenadores, mantenido por especialistas sin ánimo de lucro. http://slashdot.org

Barrapunto: portal nacido en 1999 a semejanza de Slashdot pero enfocado al ámbito hispano. http://barrapunto.com

SourceForge: el mayor portal de desarrollo de software de código fuente abierto, con más de 100.000 proyectos. http://sourceforge.net

Free Software Foundation (FSF): Fundación para el Software Libre. http://fsf.org

Open Source Initiative (OSI): la Iniciativa para el Código fuente Abierto. http://opensource.org

“Linux for Translators”, Grupo de Yahoo. http://groups.yahoo.com/group/linuxfortranslators/

CALIBRE: projecto europeo de acción cordinada EU FP6 llevado a cabo por las autoridades líderes en el software libre y de código fuente abierto, consorcio interdisciplinar de 12 equipos académicos e industriales de investigación de Francia, Irlanda, Italia, Holanda, Polonia, España, Suecia, Reino Unido y China. http://calibre.ie

MERLOT (Multimedia Educational Resource for Learning and Online Teaching): plataforma gratuita y abierta para estudiantes y universitarios. www.merlot.org

Referencias en Internet

VV. AA. (1999) Open Sources: Voices from the Open Source Revolution. Libro digital accesible en www.oreilly.com/catalog/opensources/book/toc.html

La Pastilla Roja: publicación digital sobre el software libre. www.lapastillaroja.net

Mas i Hernàndez, J. (2005) Software libre: técnicamente viable, económicamente sostenible y socialemente justo. Accesible al registrarse gratuitamente en el portal Infonomía. www.infonomia.com/textos/llibreejmas.pdf

Seoane Pascual, J.; González Barahona, J. M.; y Robles Martínez, G. (2005) Curso de introducción al software libre, accesible gratuitamente en http://curso-sobre.berlios.de/introsobre/

Matellán Olivera, V.; González Barahona, J. M.; de las Heras Quirós, P.; y Robles Martínez, G. (eds.) Sobre software libre: casi una treintena de ensayos sobre el software libre, con algunos artículos firmados por Richard Stallman, uno de los gurús del movimiento. Accesible gratuitamente en http://gsyc.escet.urjc.es/~grex/sobre-libre/

Gay, J. (ed.)(2002) Free software, Free society: Selected essays of Richard M. Stallman. Introducción de L. Lessig. Accesible gratuitamente en www.gnu.org/philosophy/fsfs/rms-essays.pdf


Procesos y datos en informática



En informática existen básicamente 2 tipos de elementos abstractos:

-Datos: por ejemplo, en Prolog se presentan los hechos y la estructura en que se organizan.

-Algoritmos o procesos: en Prolog correspondería con las reglas.

Los datos suelen representarse en forma de cuadrado, y los procesos en forma de círculo.



volando...

Este es el texto que estamos descomponiendo en clase...
http://es.wikipedia.org/wiki/Mariposa

domingo, marzo 05, 2006

PREGUNTAS POR LA RED...

¿Por qué poseen todos los idiomas expresiones conceptualmente equivalentes pero morfo-fonológicamente distintas?

¿Por qué existen asimetrías de forma en las expresiones de los lenguajes naturales ?

(ej.: asimetría prefijo/sufijo; asimetría modificador externo/interno)

¿Por qué admiten los idiomas diferentes formas de una misma entidad conceptual?

(causal léxico/sintáctico: pronombres fuertes/débiles)

¿Por qué las categorías gramaticales forman parte de pequeños conjuntos y por qué son limitadas sus combinaciones y dependencias?

jueves, marzo 02, 2006

Clase sobre traducción automática



Hoy estuvimos discutiendo la arquitectura de un sistema de TA, y se explicaron los distintos métodos (traducción directa o palabra por palabra, por transferencia o por interlingua), que aparecen en la imagen adjunta (tomada de Speech and Language Processing, de D. Jurafsky y J. H. Martin, 2000).


Planteamos qué métodos de representación de la lengua se pueden emplear para transformar el lenguaje natural en lenguaje formal que entienda la máquina (que a su vez se ha de transformar en lenguaje de conocimiento).

El proceso es:

flujo de entrada -> transformación en lenguaje máquina -> transformación en conocimiento -> transformación en lenguaje máquina de salida -> flujo de salida

En cuanto al lenguaje de conocimiento y de representación de la interlingua, hay modelos basados en la semántica léxica (vid. "The Lexical Semantics of Machine Translation Interlingua", por Rick Morneau, en www.eskimo.com/~ram/lexical_semantics.html).

El resto sigue como debate.

Resumiendo el pensamiento...

En clase
Hemos estado buscando respuestas a nuevos problemas relacionados con la traducción automática:
1. ¿Hay diferentes niveles? ¿De donde se debe partir? ¿De la palabra? ¿De conocimientos? ¿De prototipos?
2. ¿Cual es el sistema de representacion del conocimiento?
3.¿Cual es el sistema de representacion del lenguaje?
4.¿Es necesario tener una teoria sobre el lenguaje?
5¿Es necesario "conocer" el lenguaje usado por la maquina antes que el lenguaje usado por el ser humano?

*Nota: el lenguaje humano se reduce también a ceros y unos.

Curso de traducción automática

Hola

Joseba Abaitua es especialista de traducción automática y tiene accesible un curso introductorio en internet:

http://www.serv-inf.deusto.es/abaitua/konzeptu/ta/mt10h_es/index.html

Un saludo

Procesamiento del lenguaje natural curso 2006

Procesamiento del lenguaje natural curso 2006