La compañía Facebook anunció el lanzamiento de M2M-100, el que asegura es el primer modelo de traducción automática multilingüe (MMT), capaz de traducir entre 100 idiomas, sin necesidad de usar los datos del inglés.
Los principales modelos multilingües disponibles están centrados en el inglés. Por ejemplo, para traducir del chino al francés, en realidad lo que hacen es llevar el contenido del chino al inglés y desde este idioma al francés.
“Nuestro modelo entrega directamente los datos del chino al francés, lo que permite preservar mejor el significado original”, afirmó Angela Fan, investigadora asistente de Facebook AI, la división de inteligencia artificial de la compañía.
Según Facebook, el modelo M2M-100 supera en 10 puntos a los centrados en el inglés, de acuerdo a la métrica BLEU (Bilingual Evaluation Understudy), un método de evaluación de la calidad de los sistemas de traducción automática.
Para conseguir estos resultados, la compañía construyó un conjunto de datos de 7,500 millones de oraciones para 100 idiomas.
De esta forma, pudo crear un modelo de traducción universal con más de 15 mil millones de parámetros, que es capaz de «capturar información de lenguajes relacionados y refleja un guión más diverso de lenguajes y morfología”, de acuerdo a Facebook.
La compañía espera que la implementación de este modelo mejore la calidad de las traducciones para miles de millones de personas, especialmente quienes hablan idiomas distintos del inglés. Del total de las publicaciones difundidas diariamente por Facebook en 160 idiomas, dos tercios no están en inglés.
La compañía liberó como código abierto la configuración del modelo, además de la capacitación y la evaluación, para permitir que otros investigadores lo perfeccionen, precisó.