Si. Aqui está...La primavera!!
miércoles, marzo 29, 2006
lunes, marzo 27, 2006
piénsalo...es tu responsabilidad...
¿Existe un "discurso electrónico" general en Internet?
¿El discurso en el correo electrónico es igual que en los chats?
¿Hay factores extralingüísticos que den lugar a distintos tipos de discurso en los mensajes de correo electrónico? ¿Y en los chats?
¿Cambia en algo el discurso cuando se utiliza el correo electrónico para practicar una lengua extranjera?
¿Qué ocurre con las variedades de una lengua? ¿Qué consecuencias puede tener el acceso fácil y rápido a Webs procedentes de distintas zonas dialectales? ¿Y si el que accede a esas Webs es un aprendiz (no nativo) de la lengua?
¿Y la terminología para hablar de Internet? ¿La adoptamos del inglés? ¿La adaptamos? ¿La reinventamos? ¿Existe una norma clara al respecto?
;)
viernes, marzo 24, 2006
Las próximas clases...
En cualquier caso creo que la reflexión ha sido positiva y necesaria.
La próxima semana empezaremos con el proyecto plankton,algo más concreto, más descriptivo y mucho más compuatcional. Espero que os sea de más utilidad.
saludos y buen finde
Eduardo
viernes, marzo 17, 2006
Las cinco vocales y Lucía Echevarría (Off topic)
Carta dirigida a la escritora Lucía Echevarría. La famosa escritora dijo en una entrevista, que "murciélago" era la única palabra en el idioma español-castellano, que contenía las 5 vocales y D. José Fernando Blanco Sánchez, envió esta carta a un periódico para ampliar su conocimiento.
Carta al director en un diario nacional... Hace pocos días.
"Acabo de ver en la televisión estatal a Lucía Echevarría diciendo que 'murciélago' es la única palabra en nuestro idioma que tiene las cinco vocales.
¡Confiturera, frene la euforia!. Un arquitecto escuálido llamado Aurelio (o Eulalio... O Ausencio) dice que lo más auténtico es tener un abuelito que lleve un traje reticulado y siga el arquetipo de aquél viejo reumático, desahuciado y repudiado, que consiguiera en su tiempo ser esquilado por un comunicante que cometió adulterio con una encubridora cerca del estanquillo (sin usar estimulador).
Señora escritora: si el peliagudo enunciado de la ecuación la deja irresoluta, olvide su menstruación y piense de modo jerárquico. No se atragante con esta perturbación, que no va con su milonguera y meticulosa educación, y repita conmigo, como diría Cantinflas: ¡Lo que es la falta de ignorancia!"
Fdo. José Fernando Blanco Sánchez.
jueves, marzo 16, 2006
La Traducción Automática: enfoques y métodos
1.-Introducción
La traducción automática se emplea como ayuda a los traductores, normalmente centrados en áreas concretas, manuales técnicos, textos legales...
No resultan útiles en textos literarios, ensayos, etc, ya que no se puede "traducir" la creatividad del autor.
Se emplean en organizaciones internacionales, Unión Europea(SYSTRAN) y otros.
Normalmente los textos traducidos requieren un apoyo del traductor, tanto antes como después
- Preedición: Simplificando el lenguaje de entrada para evitar estructuras complejas o vocabulario que pueda llevar a confución. Se puede utilizar también un lenguaje de control para poner marcas al traductor.
- Postedición: Revisando las construcciones y el vocabulario y eliminando las marcas del lenguaje de control.
Es especialmente efectiva en áreas que emplean un lenguaje especializado o un sublenguaje.
2.-Traducción de textos
Tipos:
- Traducción basada en reglas:(Rule Based Machine Translation, RBMT)
- Traducción directa
- Transferencia
- Interlengua:Esperanto o Traducción basada en el conocimiento (Knowledge Based Machine Traslation,KBMT)
- Traducción basada en Analogías(Analogy Based Machine Translation ABMT)
- Corpus Paralelo y aplicaciones derivadas
- Traducción automática basada en ejemplos: basada en glosario, patrones...
- Métodos estadísticos
- Métodos mixtos
- Sistemas multimotores
- Traducción híbrida
Están bastante poco desarrollados
4.-Ejemplo de la traducción automática en la web
Traducción automática en Internet y en chats.
Los principales problemas vienen del uso de lenguaje coloquial
5.-Aplicaciones futuras de la traducción automática
Subtítulos de palículas
Traducción de frases predefinidas
...
6.-Lenguas cubiertas por la traducción automática
Los Europeos son los más tratados, excepto las lenguas escandinavas, griego, húngaro,rumano...
Hay problemas con las fuentes tipográficas.
martes, marzo 14, 2006
Más sobre lenguajes inventados
Aquí hay información general
Y aquí un listado de lenguajes artificiales
¿Alguien se anima a crear uno?
Eduardo
PD: Hojeando uno encuentra cosas como esta: El Aingelja
Sabríais hacer esto??
Colocar los números impares del 1 al 31, ambos inclusive, y los números 20,32,34,38 y 40 en los 20 vértices de los 4 pentágonos y en el centro de la tela de araña, de manera que la suma de los 5 números de los vértices de cualquier pentágono sea igual a la suma de los cinco números de cualquier radio e igual a 100.
domingo, marzo 12, 2006
Exposición sobre la traducción automática
Hola
El jueves o el viernes expondré en clase el trabajo sobre "La traducción automática: enfoques y métodos
1 – Traducción de textos
1.1 – Traducción automática basada en reglas (Ruled Based Machine Translation, RBMT)
1.1.1 – Métodos basados en la traducción directa
1.1.2 – Métodos basados en la transferencia
1.1.3 – Métodos basados en la interlengua
1.2.1 - Traducción automática basada en ejemplos (Example Based Machine Translation, EBMT)
1.2.2 - Traducción automática estadística
1.2.3 – La resolución de la anáfora
Un saludo, nos vemos en clase.
viernes, marzo 10, 2006
El Verdurio
Y a partir de ahí... el Kebreni...
Todo esto que parece una broma, al menos a mí me resulta bastante divertido, nos pueda llevar a una reflexión sobre el origen de los lenguajes...
El klingonés (Klingon Language)
¿Quizá el lenguaje también sirva para identificarnos con un grupo?
¿Para diferenciarnos de otros?
¿Qué sentido tiene esto?
Enlaces de interés
Información sobre el lenguaje
Su instituto de la Lengua
Tiene una wikipedia con 65 artículos
Google tiene una página para búsquedas en klingonés!
Una Radio Alemana, Deustche Welle, ha creado un servicio en Klingonés
Y aquí un artículo de la BBC sobre el mismo...
Hay 7 veces más hablantes de klingonés que de navajo....
Kits de construcción de lenguajes
http://pueblacity.com/ego-pdf/sp/lng/como/index.html
Language Construction Kit de Mark Rosenfelder: www.zompist.com/kit.html
jueves, marzo 09, 2006
Sobre software libre
Hay que explicar la diferencia entre los distintos tipos de programas informáticos, algunos de los cuales pueden ser gratuitos o no, o ser de muestra o con todas o sólo algunas de las funcionalidades:
·Programa clippleware: versión que se puede utilizar con algunas funciones bloqueadas; generalmente es una muestra comercial. Por ejemplo, Trados Translator´s Workbench 7.
·Programa shareware: herramienta que el usuario puede probar y que está sujeta a un periodo temporal o a un límite de uso. Pasada esta fecha hay que pagar una licencia para continuar utilizando este programa. Un ejemplo es el programa de compresión de archivos WinZip.
·Programa de código fuente abierto: programa cuyo código fuente es accesible y puede ser modificado y mejorado, pero siempre de forma que las nuevas versiones sean también accesibles y el código fuente quede abierto. Debe ser aprobado por la Open Source Initiative (OSI, www.opensource.org). No es necesariamente gratuito, puede venderse, como Red Hat de Linux.
·Programa de libre distribución o freeware: programa en el que el creador retiene sus derechos de autor y el código fuente no es accesible. No se suele permitir un uso comercial del mismo, sino que está disponible gratuitamente. Por ejemplo, Transit TE Satellite o Adobe Acrobat Reader.
·Programas de dominio público: el creador no posee derechos de autor sobre los mismos, pero el código fuente no suele ser abierto.
·Software libre (Free Software): programa de libre uso y distribución cuyo código fuente es abierto para que el usuario pueda mejorar el programa (y compartirlo con otros) o adaptarlo a sus propias necesidades. Funcionan en el sistema operativo y gratuito GNU-Linux (aunque algunos también son compatibles con Windows) y debe ser aprobado por la FSF (Free Software Foundation), es decir, poseer la licencia GNU GPL (General Public Licence). Aunque muchos de los programas son gratuitos, la condición de software libre no es incompatible con la de pagar por estos programas, pues si se quiere tener asistencia técnica es necesario comprar una licencia. Tal hecho sucede con el entorno de productos OpenOffice (www.openoffice.org), gratuito y de código fuente abierto, contrapartida del paquete Office de Microsoft, que es el mismo producto que el entorno StarOffice de Sun Microsystems.
Algunos enlaces sobre software libre*
*Tomados de "El software libre al microscopio", J. M. González-Barahona y S. Koch, Novática. Revista de la asociación de técnicos de informática, nº 175, mayo-junio 2005, año XXXI.
Libro Blanco del software libre en España: informe realizado por equipos de especialistas para educar al futuro usuario del sofware libre. www.libroblanco.com
Asociacion de usuarios españoles de GNU/LiNUX.: asociacion sin animo de lucro, fundada en 1997, que tiene como objetivo la defensa y promoción del Software Libre. http://hispalinux.es
Slashdot: gestor de noticias sobre tecnología y ordenadores, mantenido por especialistas sin ánimo de lucro. http://slashdot.org
Barrapunto: portal nacido en
SourceForge: el mayor portal de desarrollo de software de código fuente abierto, con más de 100.000 proyectos. http://sourceforge.net
Free Software Foundation (FSF): Fundación para el Software Libre. http://fsf.org
Open Source Initiative (OSI):
“Linux for Translators”, Grupo de Yahoo. http://groups.yahoo.com/group/linuxfortranslators/
CALIBRE: projecto europeo de acción cordinada EU FP6 llevado a cabo por las autoridades líderes en el software libre y de código fuente abierto, consorcio interdisciplinar de 12 equipos académicos e industriales de investigación de Francia, Irlanda, Italia, Holanda, Polonia, España, Suecia, Reino Unido y China. http://calibre.ie
MERLOT (Multimedia Educational Resource for Learning and Online Teaching): plataforma gratuita y abierta para estudiantes y universitarios. www.merlot.org
Referencias en Internet
VV. AA. (1999) Open Sources: Voices from the Open Source Revolution. Libro digital accesible en www.oreilly.com/catalog/opensources/book/toc.html
Mas i Hernàndez, J. (2005) Software libre: técnicamente viable, económicamente sostenible y socialemente justo. Accesible al registrarse gratuitamente en el portal Infonomía. www.infonomia.com/textos/llibreejmas.pdf
Seoane Pascual, J.; González Barahona, J. M.; y Robles Martínez, G. (2005) Curso de introducción al software libre, accesible gratuitamente en http://curso-sobre.berlios.de/introsobre/
Matellán Olivera, V.; González Barahona, J. M.; de las Heras Quirós, P.; y Robles Martínez, G. (eds.) Sobre software libre: casi una treintena de ensayos sobre el software libre, con algunos artículos firmados por Richard Stallman, uno de los gurús del movimiento. Accesible gratuitamente en http://gsyc.escet.urjc.es/~grex/sobre-libre/
Gay, J. (ed.)(2002) Free software, Free society: Selected essays of Richard M. Stallman. Introducción de L. Lessig. Accesible gratuitamente en www.gnu.org/philosophy/fsfs/rms-essays.pdf
Procesos y datos en informática
En informática existen básicamente 2 tipos de elementos abstractos:
-Datos: por ejemplo, en Prolog se presentan los hechos y la estructura en que se organizan.
-Algoritmos o procesos: en Prolog correspondería con las reglas.
Los datos suelen representarse en forma de cuadrado, y los procesos en forma de círculo.
volando...
http://es.wikipedia.org/wiki/Mariposa
domingo, marzo 05, 2006
PREGUNTAS POR LA RED...
¿Por qué poseen todos los idiomas expresiones conceptualmente equivalentes pero morfo-fonológicamente distintas?
¿Por qué existen asimetrías de forma en las expresiones de los lenguajes naturales ?
(ej.: asimetría prefijo/sufijo; asimetría modificador externo/interno)
¿Por qué admiten los idiomas diferentes formas de una misma entidad conceptual?
(causal léxico/sintáctico: pronombres fuertes/débiles)
¿Por qué las categorías gramaticales forman parte de pequeños conjuntos y por qué son limitadas sus combinaciones y dependencias?
jueves, marzo 02, 2006
Clase sobre traducción automática
Hoy estuvimos discutiendo la arquitectura de un sistema de TA, y se explicaron los distintos métodos (traducción directa o palabra por palabra, por transferencia o por interlingua), que aparecen en la imagen adjunta (tomada de Speech and Language Processing, de D. Jurafsky y J. H. Martin, 2000).
Planteamos qué métodos de representación de la lengua se pueden emplear para transformar el lenguaje natural en lenguaje formal que entienda la máquina (que a su vez se ha de transformar en lenguaje de conocimiento).
El proceso es:
flujo de entrada -> transformación en lenguaje máquina -> transformación en conocimiento -> transformación en lenguaje máquina de salida -> flujo de salida
En cuanto al lenguaje de conocimiento y de representación de la interlingua, hay modelos basados en la semántica léxica (vid. "The Lexical Semantics of Machine Translation Interlingua", por Rick Morneau, en www.eskimo.com/~ram/lexical_semantics.html).
El resto sigue como debate.
Resumiendo el pensamiento...
Hemos estado buscando respuestas a nuevos problemas relacionados con la traducción automática:
1. ¿Hay diferentes niveles? ¿De donde se debe partir? ¿De la palabra? ¿De conocimientos? ¿De prototipos?
2. ¿Cual es el sistema de representacion del conocimiento?
3.¿Cual es el sistema de representacion del lenguaje?
4.¿Es necesario tener una teoria sobre el lenguaje?
5¿Es necesario "conocer" el lenguaje usado por la maquina antes que el lenguaje usado por el ser humano?
*Nota: el lenguaje humano se reduce también a ceros y unos.
Curso de traducción automática
Joseba Abaitua es especialista de traducción automática y tiene accesible un curso introductorio en internet:
http://www.serv-inf.deusto.es/abaitua/konzeptu/ta/mt10h_es/index.html
Un saludo