La traducción automática basada en reglas (RBMT, Rule Based Machine Translation)

La traducción automática basada en reglas (RBMT, Rule Based Machine Translation)

Los sistemas de traducción automática pueden clasificarse en dos grandes grupos: aquellos basados en reglas lingüísticas y los que utilizan corpus textuales.

La traducción automática basada en reglas fue el primer enfoque que se utilizó para la traducción automática y consta de varios pasos: el procesamiento sintáctico, la interpretación semántica y el procesamiento contextual del lenguaje. Es un proceso por el cual se traduce un texto de una lengua a otra a través del uso de software que se basa en el análisis de reglas lingüísticas y millones de glosarios para cada idioma.

Para representar la estructura de una oración se utiliza una estructura de árbol. Una oración en inglés, por ejemplo, normalmente consiste de 2 partes fundamentales: frase nominal y frase verbal. Estas, a su vez, se pueden subdividir en función de la estructura de la oración. Por otro lado, para determinar qué estructuras pueden ser apropiadas para una determinada oración se utilizan reglas de reescritura. Solo la oración con la estructura correcta conduce a una traducción correcta.

En la actualidad la traducción basada en reglas utiliza representaciones intermedias, por eso se la conoce como un método indirecto de traducción.

RBMT asocia reglas gramaticales, lingüísticas y diccionarios de palabras de uso común. Existen, asimismo, diccionarios especializados que contienen la terminología utilizada en ciertos sectores o disciplinas que se crean para hacer más precisa la traducción de contenidos específicos. Por lo tanto, cuando son  incorporados diccionarios especializados, el sistema de traducción basado en reglas ofrece entonces, traducciones coherentes, correctas, en el plano terminológico.

          Por ejemplo si necesitamos traducir del inglés al alemán  a girl eats an apple. (Lengua Fuente = Inglés); Lengua Meta = Alemán

Mínimamente para obtener una traducción del inglés al alemán se requiere:

1)  Un diccionario que asocie cada palabra en inglés a la correspondiente en alemán

2) Reglas que representen la estructura usual del inglés

3) Reglas que representen la estructura usual del alemán

 Y finalmente, se necesitan reglas que permitan a cada uno relacionar estas dos estructuras juntas.

 La traducción automática basada en reglas ofrece una mejor traducción desde el punto de vista de la sintaxis. Por ejemplo, las equivalencias entre género y número son en gran medida correctas.

Este sistema puede ser útil para frase de estructura sintáctica simple y cuando se posee un diccionario personalizado.

La traducción automática basada en reglas se basa en incontables reglas lingüísticas integradas y en millones de diccionarios bilingües para cada par de idiomas. Todas las etapas de análisis lingüísticos (morfológico, sintáctico y semántico) tienen necesidad de un volumen importante de información lingüística para permitir que el sistema consiga un análisis lo más claro posible de la oración fuente y de las palabras que la compone. La ambigüedad puede ser solucionada  por el traductor en el momento de la post-edición

Tipos de traducción automática

Se entiende por traducciones automáticas al software que se encarga de analizar un texto y traducirlo a una lengua destino. En general, este software suele hacer las traducciones palabra por palabra. Sin embargo, algunos nuevos programas, mediante el uso de corpus lingüísticos, logran realizar una traducción más compleja, lo que permite la traducción de frases, expresiones idiomáticas, etcétera.

La traducción automática permite a una persona entender el mensaje global de un texto traducido a su lengua materna. Sin embargo, es difícil lograr una traducción compleja y adecuada de un texto sin la revisión y corrección de un traductor.

En cuanto a traducciones automáticas, podemos encontrar distintos tipos:

– La traducción automática basada en reglas.

– La traducción automática mediante transferencia.

– La traducción automática mediante lengua intermedia.

– La traducción automática basada en corpus.

– La traducción automática estadística.

Traducción Automática Basada en Reglas (RBMT: Rule-Based Machine Translation)

Básicamente, la Traducción Automática Basada en Reglas se encarga de traducir textos reemplazando las palabras de un texto por el equivalente que sea más apropiado en la lengua destino.

Lo primero que hace el software es analizar el texto a traducir y realizar una representación simbólica interna que luego servirá para, en un nuevo documento, encontrar la creación de un texto en el idioma destino.

Traducción Automática Basada en Corpus

Como dijimos anteriormente, la traducción automática basada en reglas traduce mayormente palabra por palabra o frases pero sin revisar el contexto en el cual se encuentran dichas palabras o frases. En cambio, mediante la traducción automática basada en corpus lingüísticos se puede lograr una traducción quizá más precisa ya que compara y traduce según un corpus en el cual se basa para determinar en qué contexto está siendo utilizada la palabra o frase.

Traducción Automática Estadística

 La traducción automática basada en reglas ofrece una mejor traducción desde el punto de vista de la sintaxis que el sistema de estadísticas. Por ejemplo, las equivalencias entre género y número son en gran medida correctas.

Traducción automática mediante Interlingua

 En la traducción automática a partir de un lenguaje intermedio, el lenguaje original es transformado a una representación intermedia o interlingua, cuya estructura es independiente del lenguaje original y del lenguaje final, pero está basada en los universales lingüísticos y permite que la traducción se realice solo en dos fases: análisis y generación. El texto en el lenguaje final se obtiene a partir de su representación en el lenguaje intermedio.

Este método fue muy popular en Japón durante las décadas de 1970 y 1980 con los proyectos ATLAS y PIVOT. En Estados Unidos también hubo varios proyectos  basados en interlinguas desarrollados en ámbitos universitarios; y en Europa podemos mencionar el proyecto holandés DLT, que utiliza el esperanto como interlingua, y ROSETTA, basado en la gramática de Montague.

 Traducción automática mediante transferencia.

 Esta fundamentado sobre las bases de interlingua, y actualmente es uno de los métodos de traducción automática más utilizados. En general su funcionamiento sigue un mismo esquema, se aplican conjuntos de reglas lingüísticas, que son las que definen cuál es la correspondencia entre la estructura de una lengua respecto de otra. En una primera etapa se analiza la entrada, morfológica y sintácticamente, creando la representación interna. A partir de esta información, y mediante el uso de reglas gramaticales y vocabulario, se genera la traducción. Este método de traducción brinda un 90% de confiabilidad en el resultado obtenido  y esta es la razón por la cual estos sistemas de traducción por transferencia han sido los más usados en la última década. Existen dos tipos de traducción por transferencia, la transferencia superficial o sintáctica, cuya característica es hacer un análisis sintáctico a través del cual se transfieren las estructuras sintácticas de la lengua madre  a las estructuras sintácticas de la lengua meta; y la transferencia profunda o semántica, que construye una representación semántica dependiente de la lengua madre la cual puede consistir en una serie de estructuras que representen el significado. Este tipo de transferencia se realiza principalmente sobre los predicados y la traducción de palabras también requiere de una transferencia previa.

Comments are closed.