Skip to main content

Voicebox: el ChatGPT de audio que está estrenando Meta

Una nueva revolución en IA ha presentado este viernes 16 de junio la gente de Meta, quizás tratando de ponerse al día con sus competidores en el área como Google u OpenAI. Esta funcionalidad se llama Voicebox, y se trata de un generador de audio a partir de texto.

Voicebox es un generador de texto a salida como GPT o Dall-E, solo que en lugar de crear párrafos o imágenes, entrega clips de audio. Meta define el sistema como «un modelo de coincidencia de flujo no autorregresivo entrenado para rellenar el habla, dado el contexto de audio y el texto». Ha sido entrenado en más de 50,000 horas de audio sin filtrar. Específicamente, Meta usó discursos grabados y transcripciones de un montón de audiolibros de dominio público escritos en inglés, francés, español, alemán, polaco y portugués.

Imagen utilizada con permiso del titular de los derechos de autor

«Nuestros resultados muestran que los modelos de reconocimiento de voz entrenados en voz sintética generada por Voicebox funcionan casi tan bien como los modelos entrenados en voz real», convienen en Meta.

El sistema se enseñó por primera vez a predecir segmentos del habla en función de los segmentos que los rodean, así como de la transcripción del pasaje. «Habiendo aprendido a rellenar el habla a partir del contexto, el modelo puede aplicar esto a través de las tareas de generación de voz, incluida la generación de porciones en medio de una grabación de audio sin tener que recrear toda la entrada», explicaron los investigadores de Meta.

Según los informes, Voicebox también es capaz de editar activamente clips de audio, eliminando el ruido del discurso e incluso reemplazando palabras mal habladas. «Una persona podría identificar qué segmento crudo del discurso está corrompido por el ruido (como el ladrido de un perro), recortarlo e instruir al modelo para regenerar ese segmento», dijeron los investigadores de Meta.

Ni la aplicación Voicebox ni su código fuente se están lanzando al público en este momento, confirmó Meta el viernes, citando «los riesgos potenciales del mal uso» a pesar de los «muchos casos de uso emocionantes para los modelos de habla generativa».

Acá se puede escuchar una demostración.

Recomendaciones del editor

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
El modo incógnito de Google está en problemas
Pantalla en modo incógnito de Chrome

Captura de pantalla / DigitalTrends.com
Google pronto podría verse obligado a eliminar los datos privados de millones de usuarios si se aprueba el acuerdo propuesto de una demanda colectiva, según The Verge.

La propuesta de acuerdo es parte del caso Brown v. La demanda de Google, por la que el gigante tecnológico ha acordado "destruir o desidentificar" los datos de navegación web que ha guardado de las personas que utilizan la función "Modo incógnito" en el navegador Google Chrome. Google sería responsable de eliminar miles de millones de registros y asegurarse de que los registros imborrables no estén asociados con usuarios individuales.

Leer más
El protagonista de Malcolm contó el día que se escapó dos veces del set
frankie muniz malcolm escape in the middle

El protagonista de la serie de culto, Malcolm in the Middle, Frankie Muniz, relató un momento oculto del programa y cómo logró escabullirse del set de grabación para dos episodios completos.
News.com.au sitio web informa que el ex actor estadounidense estaba compartiendo confidencias con sus compañeros de campamento en I'm A Celebrity Australia cuando reveló:
"Hubo dos episodios en los que no estoy. Salí del set". Y explicó que sus acciones se debieron a que la tensión en el set había llegado a un punto de ebullición, debido al comportamiento de otras "ciertas personas".
"Todo el mundo tenía mucho miedo de ponerse de pie cuando ciertas personas eran controladoras, groseras o irrespetuosas. Como si caminaran sobre alfileres y agujas", recordó.

Muniz reconoció que no estaba asustado de que ese escape pudiera traerle consecuencias a futuro. "No me importaba si me decían que nunca iba a volver, porque para mí valía la pena. Ayudó el hecho de que la serie se basara en mí".

Leer más
Así será la versión extra gratuita de ChatGPT
¿Qué es ChatGPT? Cómo usar el chatbot del que todo el mundo habla.

Una versión aún más extra gratuita de ChatGPT está debutando desde este 1 de abril, ya que a partir de hoy en algunos mercados y extendiéndose gradualmente al resto del mundo, visitar chat.openai.com ya no te pedirá que inicies sesión, aunque aún puedes hacerlo si lo deseas. En su lugar, se le permitirá entablar una conversación con ChatGPT, que utilizará el mismo modelo que los usuarios registrados.

Por supuesto, esta versión será incluso más limitada que la edición gratis a la que se accede con registro, y tendrá algunas diferencias sustanciales:

Leer más