Skip to main content

Voicebox: el ChatGPT de audio que está estrenando Meta

Una nueva revolución en IA ha presentado este viernes 16 de junio la gente de Meta, quizás tratando de ponerse al día con sus competidores en el área como Google u OpenAI. Esta funcionalidad se llama Voicebox, y se trata de un generador de audio a partir de texto.

Voicebox es un generador de texto a salida como GPT o Dall-E, solo que en lugar de crear párrafos o imágenes, entrega clips de audio. Meta define el sistema como «un modelo de coincidencia de flujo no autorregresivo entrenado para rellenar el habla, dado el contexto de audio y el texto». Ha sido entrenado en más de 50,000 horas de audio sin filtrar. Específicamente, Meta usó discursos grabados y transcripciones de un montón de audiolibros de dominio público escritos en inglés, francés, español, alemán, polaco y portugués.

Imagen utilizada con permiso del titular de los derechos de autor

«Nuestros resultados muestran que los modelos de reconocimiento de voz entrenados en voz sintética generada por Voicebox funcionan casi tan bien como los modelos entrenados en voz real», convienen en Meta.

El sistema se enseñó por primera vez a predecir segmentos del habla en función de los segmentos que los rodean, así como de la transcripción del pasaje. «Habiendo aprendido a rellenar el habla a partir del contexto, el modelo puede aplicar esto a través de las tareas de generación de voz, incluida la generación de porciones en medio de una grabación de audio sin tener que recrear toda la entrada», explicaron los investigadores de Meta.

Según los informes, Voicebox también es capaz de editar activamente clips de audio, eliminando el ruido del discurso e incluso reemplazando palabras mal habladas. «Una persona podría identificar qué segmento crudo del discurso está corrompido por el ruido (como el ladrido de un perro), recortarlo e instruir al modelo para regenerar ese segmento», dijeron los investigadores de Meta.

Ni la aplicación Voicebox ni su código fuente se están lanzando al público en este momento, confirmó Meta el viernes, citando «los riesgos potenciales del mal uso» a pesar de los «muchos casos de uso emocionantes para los modelos de habla generativa».

Acá se puede escuchar una demostración.

Recomendaciones del editor

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Se acabó la luna de miel: el tráfico de ChatGPT baja por tercer mes consecutivo
trafico de chatgpt baja por tercer mes consecutivo rolf van root lyi1t85lry8 unsplash

En concordancia con las leyes físicas de Newton, todo lo que sube tiene que bajar y la gravedad está haciendo de las suyas con ChatGPT, que después de un explosivo crecimiento en los primeros meses de 2023, empezó su caída en tráfico,  según la firma de análisis Similarweb.

Las visitas mundiales de sitios web de escritorio y móviles al sitio web de ChatGPT disminuyeron un 3,2% a 1.43 millones en agosto, luego de caídas de aproximadamente el 10% con respecto a cada uno de los dos meses anteriores. La cantidad de tiempo que los visitantes pasaron en el sitio web también ha disminuido mensualmente desde marzo, de un promedio de 8.7 minutos en el sitio a 7 minutos en el sitio en agosto.

Leer más
ChatGPT: qué es y cómo usar el chatbot del que todo el mundo habla
ChatGPT: qué es y cómo usar el chatbot del que todo el mundo habla.

ChatGPT ha ha conseguido deslumbrar a Internet con contenido generado por IA, transformándose de un novedoso chatbot a una pieza de tecnología que está impulsando la próxima era de innovación. En realidad, ningún producto tecnológico reciente ha despertado tanto interés, controversia, miedo y entusiasmo a partes iguales.

Si recién has oído sobre esto, es seguro que te estás preguntando a qué se debe tanto alboroto. Por lo pronto, puedes probarlo tú mismo de forma gratuita (o usar la aplicación oficial gratuita para iOS), pero igualmente aquí te damos una guía detallada de qué es y cómo usar Chat GPT, ya sea que estés preocupado por un apocalipsis de la IA o simplemente estés buscando una guía de introducción a esta aplicación.

Leer más
El día en que Liam Neeson se llevó un reto de George Lucas
el dia en que liam neeson se llevo un reto de george lucas qui gon jinn

El reinicio de la historia de Star Wars con las filmaciones de La Amenaza Fantasma, no solo trajo de regreso a George Lucas en la silla de director, sino que además renovó el elenco con actores de renombre como Ewan McGregor, Natalie Portman y Liam Neeson. Y justamente este último recordó esa experiencia con el podcast  "Conan O'Brien Needs A Friend" (grabado antes de la huelga SAG-AFTRA).

En la oportunidad, Qui-Gon Jinn relató cómo en la famosa pelea de sables con Darth Maul junto a Obi-Wan Kenobi se llevó un reto del gran jefe.
"La primera vez que tuvimos que usar el sable de luz para comenzar una pequeña pelea ... Ambos automáticamente [hicimos los ruidos]", dijo Neeson. "George dijo: 'Vamos a cortar allí. Chicos, podemos agregar eso más tarde'".
Liam Neeson & Ewan McGregor Made Lightsaber Sounds Filming “Star Wars”| Conan O'Brien Needs A Friend
Críticas a las producciones nuevas de Disney
Pero más allá de las anécdotas, Liam Neeson también fustigó la aparición de nuevas producciones de la mano de Disney.

Leer más