Skip to main content
  1. Home
  2. Computación
  3. Noticias
  4. News

Voicebox: el ChatGPT de audio que está estrenando Meta

Add as a preferred source on Google

Una nueva revolución en IA ha presentado este viernes 16 de junio la gente de Meta, quizás tratando de ponerse al día con sus competidores en el área como Google u OpenAI. Esta funcionalidad se llama Voicebox, y se trata de un generador de audio a partir de texto.

Voicebox es un generador de texto a salida como GPT o Dall-E, solo que en lugar de crear párrafos o imágenes, entrega clips de audio. Meta define el sistema como «un modelo de coincidencia de flujo no autorregresivo entrenado para rellenar el habla, dado el contexto de audio y el texto». Ha sido entrenado en más de 50,000 horas de audio sin filtrar. Específicamente, Meta usó discursos grabados y transcripciones de un montón de audiolibros de dominio público escritos en inglés, francés, español, alemán, polaco y portugués.

Imagen utilizada con permiso del titular de los derechos de autor

«Nuestros resultados muestran que los modelos de reconocimiento de voz entrenados en voz sintética generada por Voicebox funcionan casi tan bien como los modelos entrenados en voz real», convienen en Meta.

Recommended Videos

El sistema se enseñó por primera vez a predecir segmentos del habla en función de los segmentos que los rodean, así como de la transcripción del pasaje. «Habiendo aprendido a rellenar el habla a partir del contexto, el modelo puede aplicar esto a través de las tareas de generación de voz, incluida la generación de porciones en medio de una grabación de audio sin tener que recrear toda la entrada», explicaron los investigadores de Meta.

Según los informes, Voicebox también es capaz de editar activamente clips de audio, eliminando el ruido del discurso e incluso reemplazando palabras mal habladas. «Una persona podría identificar qué segmento crudo del discurso está corrompido por el ruido (como el ladrido de un perro), recortarlo e instruir al modelo para regenerar ese segmento», dijeron los investigadores de Meta.

Ni la aplicación Voicebox ni su código fuente se están lanzando al público en este momento, confirmó Meta el viernes, citando «los riesgos potenciales del mal uso» a pesar de los «muchos casos de uso emocionantes para los modelos de habla generativa».

Acá se puede escuchar una demostración.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Microsoft Excel tiene novedades que facilitan la gestión
Electrical Device, Switch, Credit Card

Si a menudo trabajas con datos que empiezan como archivos de texto o CSV, Microsoft Excel ahora cuenta con nuevas herramientas integradas que simplifican cómo esa información se integra en una hoja de cálculo.

La actualización introduce dos nuevas funciones, IMPORTTEXT e IMPORTCSV, diseñadas para llevar datos externos directamente a las celdas de Excel usando fórmulas. En lugar de pasar por el asistente de importación tradicional cada vez, los usuarios ahora pueden cargar archivos directamente en una hoja de cálculo y mantener esos datos conectados a su fuente.

Read more
AMD tiene chips nuevos, pero el precio de la RAM es la verdadera batalla
Green, Logo, Text

Si pensabas que 2026 iba a ser el año en que la construcción de PC volviera a ser fácil, AMD tiene malas noticias. La empresa se dirige al nuevo año enfrentándose a una tormenta perfecta de dolores de cabeza en la cadena de suministro y precios disparados. En una charla sincera con Gizmodo durante el CES, David McAfee, líder de Ryzen de AMD, explicó la situación y, sinceramente, parece que están intentando guiar un barco a través de un huracán sin perder carga.

El hardware que mostraron en el CES cuenta la historia mejor que cualquier nota de prensa. Presentaron el nuevo Ryzen 7 9850X3D y algunas APUs Strix Halo mejoradas, concretamente el Ryzen AI Max+ 388 y 382. Sobre el papel, parecen sólidos para futuros portátiles o portátiles. Pero si miras más de cerca, hay una pega: estos nuevos chips siguen funcionando con la antigua arquitectura gráfica RDNA 3.5. Todavía no están recibiendo la nueva tecnología gráfica brillante. Incluso McAfee admitió que el salto en rendimiento del anterior 9800X3D a este nuevo 9850X3D va a ser bastante menor, especialmente notable si estás jugando títulos de esports o juegos antiguos. Se siente menos como una revolución y más como si simplemente mantuvieran las luces encendidas mientras esperan a que pase la tormenta.

Read more
Puede que ahora te afecte el final de la RTX 5070 Ti
Computer Hardware, Electronics, Hardware

La RTX 5070 Ti de NVIDIA cada vez es más difícil de comprar, y la presión aparece en la compra. Sin embargo, el debate sobre el final de la vida útil de la RTX 5070 Ti está siendo impulsado por los socios de la placa, sin que NVIDIA anuncie públicamente de forma clara.

ASUS ha puesto sus propios modelos RTX 5070 Ti en estado de fin de vida útil y afirma que no tiene planes de producir más unidades porque la oferta es demasiado escasa. Eso deja a los compradores peleando por el inventario que ya hay disponible.

Read more