OpenMT
Objetivos y observaciones generales
El principal objetivo de OpenMT es el desarrollo de arquitecturas en código abierto para sistemas de traducción automática (Machine Translation, MT) que estén basadas en modelos híbridos y que utilicen procesadores semánticos avanzados. Por consiguiente, las características más importantes de nuestro proyecto son:
- Definición de arquitecturas en código abierto para sistemas de traducción automática.
- Combinación de los diferentes paradigmas de traducción automática en un sistema híbrido. Sistemas basados en reglas (Rule-Based Machine Translation, RBMT) combinado con basados en estadística (SMT) y con basados en ejemplos (Example-Based MT, EBMT)
- Integración de procesadores avanzados en sintaxis y semántica. Entre otros, trabajaremos con sistemas de etiquetado de roles semánticos (Semantic Role Labeling) y desambiguación de acepciones (Word Sense Disambiguation, WSD) adaptados a la selección y preferencia de posibles traducciones.
- Evaluación. Se generará una herramienta general y un corpus para evaluación. El sistema será evaluado mediante criterios combinados y usando diferentes lenguas y dominios. Intentaremos construir un sistema de evaluación más cercano al criterio humano que los que se usan actualmente.
Proyecto financiado por el Ministerio de Educación y Ciencia: Proyectos I+D 2006-2009
Participantes:
- Elhuyar Fundazioa
- IXA Taldea (EHU/UPV)
- Grupo TALP(UPC)
Más información:
- Alegria I., Díaz de Ilarraza A., Igartua J., Labaka G., Laskurain B., Lersundi M., Mayor A., Sarasola K., A. Casillas, X. Saralegi. 2008. Mixing Approaches to MT for Basque: Selecting the best output from RBMT, EBMT and SMT. MATMT2008 workshop: Mixing Approaches to Machine Translation.
- Proyecto OpenMT