Este martes 22 de agosto Mark Zuckerberg anunció que Meta está lanzando para sus productos el traductor hecho con IA, SeamlessM4T, que trabaja con más de 100 idiomas, y permite no solo la traducción, sino que además transformación en audio y transcripción.
Disponible en código abierto junto con SeamlessAlign, un nuevo conjunto de datos de traducción, Meta afirma que SeamlessM4T representa un «avance significativo» en el campo de la conversión de voz a voz y voz a texto impulsadas por IA.
«Nuestro modelo único proporciona traducciones bajo demanda que permiten a las personas que hablan diferentes idiomas comunicarse de manera más efectiva», escribe Meta en una publicación de blog. «SeamlessM4T reconoce implícitamente los idiomas de origen sin la necesidad de un modelo de identificación de idiomas separado».
Este traductor se basa en Massively Multilingual Speech, el marco de Meta que proporciona tecnología de reconocimiento de voz, identificación de idiomas y síntesis de voz en más de 1.100 idiomas.
Los investigadores alinearon 443,000 horas de habla con textos y crearon 29,000 horas de alineaciones de «voz a voz», que «enseñaron» a SeamlessM4T cómo transcribir voz a texto, traducir texto, generar voz a partir de texto e incluso traducir palabras habladas en un idioma a palabras en otro idioma.
«Con resultados de vanguardia, creemos que SeamlessM4T es un avance importante en la búsqueda de la comunidad de IA hacia la creación de sistemas multitarea universales», escribió Meta en la publicación del blog.