Skip to main content

DT en Español podría recibir una comisión si compras un producto desde el sitio

Esta IA puede falsificar tu voz después de solo tres segundos

La inteligencia artificial (IA) está teniendo un momento ahora, y el viento continúa soplando en sus velas con la noticia de que Microsoft está trabajando en una IA que puede imitar la voz de cualquiera después de haber sido alimentado con una breve muestra de tres segundos.

La nueva herramienta, denominada VALL-E, ha sido entrenada en aproximadamente 60.000 horas de datos de voz en inglés, que Microsoft dice que es «cientos de veces más grande que los sistemas existentes». Usando ese conocimiento, sus creadores afirman que solo necesita un poco de información vocal para comprender cómo replicar la voz de un usuario.

Hombre hablando por teléfono
Fizkes/Shutterstock

Más impresionante, VALL-E puede reproducir las emociones, los tonos vocales y el entorno acústico que se encuentran en cada muestra, algo con lo que otros programas de IA de voz han luchado. Eso le da un aura más realista y acerca sus resultados a algo que podría pasar como un discurso humano genuino.

En comparación con otros competidores de texto a voz (TTS), Microsoft dice que VALL-E «supera significativamente al sistema TTS de disparo cero de última generación en términos de naturalidad del habla y similitud del altavoz». En otras palabras, VALL-E suena mucho más como humanos reales que como IA rivales que encuentran entradas de audio en las que no han sido entrenados.

En GitHub, Microsoft ha creado una pequeña biblioteca de ejemplos creados con VALL-E. Los resultados son en su mayoría muy impresionantes, con muchas muestras que reproducen el tono y el acento de las voces de los oradores. Algunos de los ejemplos son menos convincentes, lo que indica que VALL-E probablemente no sea un producto terminado, pero en general el resultado es convincente.

Enorme potencial y riesgos

Una persona que realiza una videollamada en un dispositivo Microsoft Surface que ejecuta Windows 11.
Microsoft/Unsplash

En un documento que presenta VALL-E, Microsoft explica que VALL-E «puede conllevar riesgos potenciales en el mal uso del modelo, como falsificar la identificación de voz o hacerse pasar por un altavoz específico». Una herramienta tan capaz de generar un discurso que suene realista plantea el espectro de deepfakes cada vez más convincentes, que podrían usarse para imitar cualquier cosa, desde una ex pareja romántica hasta una personalidad internacional prominente.

Para mitigar esa amenaza, Microsoft dice que «es posible construir un modelo de detección para discriminar si un clip de audio fue sintetizado por VALL-E». La compañía dice que también utilizará sus propios principios de IA al desarrollar su trabajo. Esos principios abarcan esferas como la equidad, la seguridad, la privacidad y la rendición de cuentas.

VALL-E es solo el último ejemplo de la experimentación de Microsoft con la IA. Recientemente, la compañía ha estado trabajando en la integración de ChatGPT en Bing, utilizando IA para recapitular sus reuniones de Teams e injertando herramientas avanzadas en aplicaciones como Outlook, Word y PowerPoint. Y según Semafor, Microsoft está buscando invertir $ 10 mil millones en el fabricante de ChatGPT OpenAI, una compañía en la que ya ha invertido fondos significativos.

A pesar de los riesgos aparentes, herramientas como VALL-E podrían ser especialmente útiles en medicina, por ejemplo, para ayudar a las personas a recuperar su voz después de un accidente. Ser capaz de replicar el habla con un conjunto de entradas tan pequeño podría ser inmensamente prometedor en estas situaciones, siempre que se haga bien. Pero con todo el dinero que se gasta en IA, tanto por Microsoft como por otros, está claro que no va a desaparecer pronto.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
El Meta Quest recibe un increíble accesorio de realidad virtual
meta quest 3 lapiz optico

Logitech
Logitech ha anunciado su primera pieza de hardware en el espacio de realidad virtual, un lápiz óptico que te permite dibujar y pintar en 3D en Meta Quest 3. El MX Ink Stylus es una herramienta de dibujo de aspecto familiar que trabaja mano a mano con el controlador Quest para expandir drásticamente las capacidades de los populares auriculares Quest 3 VR.

MX Ink también funciona con Quest Pro y Quest 2 y es compatible con varias aplicaciones de pintura y escultura de Quest, incluidas Gravity Sketch, PaintingVR, OpenBrush, ShapesXR, GestureVR, Arkio y Engage XR. Si conectas tu Quest a una PC preparada para la realidad virtual, puedes usar el lápiz óptico MX Ink con Substance Modeler de Adobe y Elucis de Realize Medical.

Leer más
Hablar con un avatar se siente más real con Character.AI
hablar avatar se siente mas real character ai characater

Character.AI
Character.AI, la popular startup de avatares digitales, anunció el jueves que los usuarios ahora podrán mantener conversaciones en tiempo real con uno de los muchos agentes de IA de la compañía colocando una llamada de personaje ficticia gratuita en la aplicación.

La compañía ha estado construyendo chatbots inteligentes diseñados para involucrar a los usuarios en conversaciones interactivas desde la fundación de la compañía en 2021. Inicialmente, los usuarios solo podían interactuar con estos personajes como lo haría cualquier otro chatbot como Gemini o Claude, haciéndolo a través de mensajes de texto. Eso cambió en marzo de 2024, cuando la compañía presentó Character Voice, un conjunto de herramientas gratuitas que incluye una biblioteca de más de un millón de voces generadas por IA creadas tanto por el equipo de Character.ai como por su comunidad de usuarios, que permitía a los usuarios hablar con sus avatares seleccionados en conversaciones individuales.

Leer más
El futuro de los auriculares Meta Quest acaba de filtrarse
Meta Quest- Zuckerberg

Los populares auriculares Quest 3 salieron el año pasado, pero según una nueva filtración, el Quest 4 y el Quest Pro de segunda generación también están en la hoja de ruta de Meta.

La hoja de ruta recientemente filtrada proviene de un informe publicado por The Information, que detalla la línea de tiempo que Meta pretende alcanzar con Quest 4 y Quest Pro 2. Fuentes anónimas dentro de Meta afirman que habrá dos variantes del Quest 4, presumiblemente un modelo estándar y premium, con nombre en código Pismo Low y Pismo High. Dado que tenemos datos sólidos sobre el rumoreado Quest 3S, el modelo de menor costo podría terminar siendo el Quest 4S. En cualquier caso, se espera que ambas variantes del Quest 4 se lancen en 2026.

Leer más