Skip to main content

Voicebox: el ChatGPT de audio que está estrenando Meta

Una nueva revolución en IA ha presentado este viernes 16 de junio la gente de Meta, quizás tratando de ponerse al día con sus competidores en el área como Google u OpenAI. Esta funcionalidad se llama Voicebox, y se trata de un generador de audio a partir de texto.

Voicebox es un generador de texto a salida como GPT o Dall-E, solo que en lugar de crear párrafos o imágenes, entrega clips de audio. Meta define el sistema como «un modelo de coincidencia de flujo no autorregresivo entrenado para rellenar el habla, dado el contexto de audio y el texto». Ha sido entrenado en más de 50,000 horas de audio sin filtrar. Específicamente, Meta usó discursos grabados y transcripciones de un montón de audiolibros de dominio público escritos en inglés, francés, español, alemán, polaco y portugués.

Imagen utilizada con permiso del titular de los derechos de autor

«Nuestros resultados muestran que los modelos de reconocimiento de voz entrenados en voz sintética generada por Voicebox funcionan casi tan bien como los modelos entrenados en voz real», convienen en Meta.

Recommended Videos

El sistema se enseñó por primera vez a predecir segmentos del habla en función de los segmentos que los rodean, así como de la transcripción del pasaje. «Habiendo aprendido a rellenar el habla a partir del contexto, el modelo puede aplicar esto a través de las tareas de generación de voz, incluida la generación de porciones en medio de una grabación de audio sin tener que recrear toda la entrada», explicaron los investigadores de Meta.

Según los informes, Voicebox también es capaz de editar activamente clips de audio, eliminando el ruido del discurso e incluso reemplazando palabras mal habladas. «Una persona podría identificar qué segmento crudo del discurso está corrompido por el ruido (como el ladrido de un perro), recortarlo e instruir al modelo para regenerar ese segmento», dijeron los investigadores de Meta.

Ni la aplicación Voicebox ni su código fuente se están lanzando al público en este momento, confirmó Meta el viernes, citando «los riesgos potenciales del mal uso» a pesar de los «muchos casos de uso emocionantes para los modelos de habla generativa».

Acá se puede escuchar una demostración.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
AMD está dando una vuelta de la victoria con el nuevo Ryzen 9 9950X3D
AMD

En este punto, AMD ha estado en la cima cuando hablamos de los mejores procesadores para juegos, pero aún así tardó CES 2025 en dar una vuelta de la victoria y ampliar su ventaja. Al abrir el discurso de apertura, AMD reveló el Ryzen 9 9950X3D y el Ryzen 9 9900X3D, los cuales estarán disponibles en el primer trimestre de este año.

El rendimiento aquí no influye mucho, ya que AMD ya ha reclamado el primer lugar para los procesadores de juegos con su popular Ryzen 7 9800X3D. Sin embargo, como puedes ver a continuación, AMD afirma tener una ventaja del 8% sobre el Ryzen 9 7950X3D de la última generación de media después de probar 40 juegos. Como era de esperar, juegos gráficamente intensivos como Avatar: Frontiers of Pandora y Black Myth: Wukong ven pocos beneficios, pero AMD reclama una ventaja de hasta el 58% en un juego como Counter-Strike 2.
AMD
Una ventaja del 8% está bien, pero AMD realmente muestra su destreza en los juegos contra Intel. En comparación con el Core Ultra 9 285K, AMD dice que el Ryzen 9 9950X3D es un 20% más rápido de media a 1080p. Todavía hay esos juegos gráficamente exigentes, pero AMD afirma aumentos de hasta el 40% en Warhammer 40K: Space Marine 2 y el 64% en Watch Dogs: Legion.
AMD
No es de extrañar que las nuevas CPU de AMD dominen en los juegos, teniendo en cuenta que incluyen la segunda generación de V-Cache 3D de AMD. Sin embargo, a diferencia del Ryzen 7 9800X3D que ya está disponible, el Ryzen 9 9900X3D y el Ryzen 9 9950X3D están orientados tanto para cargas de trabajo de juego como de productividad con 12 y 16 núcleos, respectivamente. En ese frente, los márgenes son un poco más estrechos.
AMD
En comparación con Intel, AMD dice que es alrededor de un 10% más rápido en todas las cargas de trabajo de productividad. La batalla está reñida en aplicaciones de renderizado como Blender y Cinebench, un área donde las últimas CPU de Intel son particularmente fuertes, pero AMD sale adelante por márgenes del 14% en Premiere Pro y un enorme 47% en Photoshop.
AMD
Para la comparación de generación a generación, AMD afirma una ventaja del 13%, aunque con muchos menos picos y valles de lo que se puede ver en la comparación de Intel. Las últimas CPU  Zen 5 de AMD no tienen grandes saltos sobre las opciones Zen 4 de última generación, pero son consistentemente más rápidas en casi todas las aplicaciones.
AMD
Como siempre es el caso, es importante tratar estos números de rendimiento con una buena dosis de escepticismo. Vi algunas brechas de rendimiento bastante grandes entre las afirmaciones de AMD y el rendimiento en el mundo real con chips como el Ryzen 7 9700X y el Ryzen 5 9600X, un problema que AMD finalmente abordó a través de varias actualizaciones.

Leer más
Sam Altman admite una derrota con ChatGPT Pro: «pensé que ganaríamos dinero»
Sam Altman

El CEO de OpenAI, Sam Altman, está un poco arrepentido con una de sus decisiones sobre ChatGPT, ya que la plataforma Pro que cuesta 200 dólares al mes para entregar mejores resultados de conversación y búsqueda y resolución, no ha sido lo esperado en ganancias para la compañía.
"Personalmente, elegí el precio", escribió Altman en una serie de publicaciones en X, "y pensé que ganaríamos algo de dinero".
ChatGPT Pro, lanzado a fines del año pasado, otorga acceso a una versión mejorada del modelo de IA de "razonamiento" o1 de OpenAI, el modo o1 pro, y elimina los límites de velocidad en varias de las otras herramientas de la compañía, incluido su generador de video Sora.
Incluso, en una entrevista reciente con Bloomberg, Altman dijo que el plan premium original para el chatbot impulsado por IA de OpenAI, ChatGPT, no tenía un estudio de precios.
"Creo que probamos dos precios, 20 y 42 dólares", dijo a la publicación. "La gente pensaba que 42 dólares era demasiado. Estaban felices de pagar 20 dólares. Elegimos $20. Probablemente fue a finales de diciembre de 2022 o principios de enero. No se trataba de un riguroso 'contrata a alguien y haz un estudio de precios'".
Aún así OpenAI proyecta con optimismo que sus ingresos alcanzarán los 11.600 millones de dólares este año y los 100.000 millones de dólares en 2029, igualando las ventas anuales actuales de Nestlé.

Leer más
Este loco espejo inteligente es mejor que el de la Blancanieves
espejo inteligente omnia withings

El espejo futurista Omnia de Withings te dirá todo lo que necesitas saber sobre tu salud y bienestar, y probablemente algunas cosas que preferirías ignorar justo después del reciente período festivo, con solo pararte frente a él. Su objetivo es reunir inteligentemente sus propios datos con la información recopilada de la gama de dispositivos de salud conectados de Withings, como el reloj inteligente Withings ScanWatch 2, para proporcionar lo que llama una "vista de 360 grados de sus indicadores vitales".

Omnia recopila la impresionante cantidad de 60 parámetros diferentes de salud y estado físico, con la parte de 360 grados de la explicación que proviene de escaneos realizados por la base conectada, otros productos Withings e información recopilada de otras fuentes. Los datos van desde la composición corporal y el peso hasta la calidad del sueño y la capacidad pulmonar, y todo se presenta en el espejo, justo delante de ti.

Leer más