Skip to main content

DT en Español podría recibir una comisión si compras un producto desde el sitio

Esta IA puede falsificar tu voz después de solo tres segundos

La inteligencia artificial (IA) está teniendo un momento ahora, y el viento continúa soplando en sus velas con la noticia de que Microsoft está trabajando en una IA que puede imitar la voz de cualquiera después de haber sido alimentado con una breve muestra de tres segundos.

La nueva herramienta, denominada VALL-E, ha sido entrenada en aproximadamente 60.000 horas de datos de voz en inglés, que Microsoft dice que es «cientos de veces más grande que los sistemas existentes». Usando ese conocimiento, sus creadores afirman que solo necesita un poco de información vocal para comprender cómo replicar la voz de un usuario.

Hombre hablando por teléfono
Fizkes/Shutterstock

Más impresionante, VALL-E puede reproducir las emociones, los tonos vocales y el entorno acústico que se encuentran en cada muestra, algo con lo que otros programas de IA de voz han luchado. Eso le da un aura más realista y acerca sus resultados a algo que podría pasar como un discurso humano genuino.

En comparación con otros competidores de texto a voz (TTS), Microsoft dice que VALL-E «supera significativamente al sistema TTS de disparo cero de última generación en términos de naturalidad del habla y similitud del altavoz». En otras palabras, VALL-E suena mucho más como humanos reales que como IA rivales que encuentran entradas de audio en las que no han sido entrenados.

En GitHub, Microsoft ha creado una pequeña biblioteca de ejemplos creados con VALL-E. Los resultados son en su mayoría muy impresionantes, con muchas muestras que reproducen el tono y el acento de las voces de los oradores. Algunos de los ejemplos son menos convincentes, lo que indica que VALL-E probablemente no sea un producto terminado, pero en general el resultado es convincente.

Enorme potencial y riesgos

Una persona que realiza una videollamada en un dispositivo Microsoft Surface que ejecuta Windows 11.
Microsoft/Unsplash

En un documento que presenta VALL-E, Microsoft explica que VALL-E «puede conllevar riesgos potenciales en el mal uso del modelo, como falsificar la identificación de voz o hacerse pasar por un altavoz específico». Una herramienta tan capaz de generar un discurso que suene realista plantea el espectro de deepfakes cada vez más convincentes, que podrían usarse para imitar cualquier cosa, desde una ex pareja romántica hasta una personalidad internacional prominente.

Para mitigar esa amenaza, Microsoft dice que «es posible construir un modelo de detección para discriminar si un clip de audio fue sintetizado por VALL-E». La compañía dice que también utilizará sus propios principios de IA al desarrollar su trabajo. Esos principios abarcan esferas como la equidad, la seguridad, la privacidad y la rendición de cuentas.

VALL-E es solo el último ejemplo de la experimentación de Microsoft con la IA. Recientemente, la compañía ha estado trabajando en la integración de ChatGPT en Bing, utilizando IA para recapitular sus reuniones de Teams e injertando herramientas avanzadas en aplicaciones como Outlook, Word y PowerPoint. Y según Semafor, Microsoft está buscando invertir $ 10 mil millones en el fabricante de ChatGPT OpenAI, una compañía en la que ya ha invertido fondos significativos.

A pesar de los riesgos aparentes, herramientas como VALL-E podrían ser especialmente útiles en medicina, por ejemplo, para ayudar a las personas a recuperar su voz después de un accidente. Ser capaz de replicar el habla con un conjunto de entradas tan pequeño podría ser inmensamente prometedor en estas situaciones, siempre que se haga bien. Pero con todo el dinero que se gasta en IA, tanto por Microsoft como por otros, está claro que no va a desaparecer pronto.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
¿Se acaba el mareo por movimiento?, pero no en el Vision Pro
mareo por movimiento caracteristica no esta apple vision pro meta quest 3

Meta/Apple
Un nuevo estudio sobre la comodidad de la realidad virtual sugiere que algunos de los mejores cascos de realidad virtual tienen una característica que puede ayudar a prevenir el mareo por movimiento. También conocido como enfermedad del simulador, el problema se debe a un desajuste entre lo que se ve en una pantalla montada en la cabeza (HMD) y lo que se siente en la realidad.

Es bien sabido que los jugadores prefieren fotogramas por segundo (fps) más altos para poder reaccionar más rápidamente y apuntar con mayor precisión. Sin embargo, según un estudio reciente, una frecuencia de actualización más rápida también puede reducir las posibilidades de que experimente náuseas o vértigo después de jugar un juego de realidad virtual con mucho movimiento.

Leer más
Tu Quest 3 ahora es mucho mejor y gratis
quest 3 mucho mejor gratis

First Encounter es la introducción perfecta a la realidad mixta en Quest 3. Meta
El Quest 3 ya contaba con la mejor experiencia de realidad mixta de cualquier auricular de realidad virtual que no fuera el Apple Vision Pro. Ahora, como parte de la actualización v64, la calidad de paso del Quest 3 está a punto de mejorar aún más, con menos granulosidad con poca luz, más detalles y un mejor manejo de las pantallas del teléfono.

La diferencia es bastante notable. Anteriormente, tenías que bajar el brillo de tu teléfono o acercarte mucho para que fuera legible. Después de la última actualización, la cámara de paso se ajusta automáticamente para que no tengas que entrecerrar los ojos ante una pantalla quemada. Para obtener una visión completa de la actualización de paso de Quest 3, echa un vistazo al video de YouTube de Meta a continuación.

Leer más
Este nuevo casco de realidad virtual supera al Vision Pro en un aspecto clave y cuesta la mitad del precio
casco realidad virtual pimax crystal supera vision pro mitad de precio pymax

Pimax
Si bien el Apple Vision Pro ofrece pantallas de ultra alta resolución con 23 millones de píxeles, el asombroso precio de $ 3,500 podría inspirarlo a buscar alternativas a Vision Pro.

Buenas noticias: Pimax acaba de anunciar dos nuevos cascos de realidad virtual, incluido un modelo económico que cuesta tan solo $ 799 y una versión más avanzada a partir de $ 1,799. Ambos se basan en el diseño de uno de los mejores cascos de realidad virtual disponibles actualmente, el Pimax Crystal que se lanzó en mayo de 2023 por 1.599 dólares, pero vienen con una importante mejora en términos de resolución.
Pimax Crystal Super
Pimax
El Pimax Crystal Super cuenta con 29,5 millones de píxeles y viene en dos configuraciones. Con 3840 x 3840 píxeles por ojo, supera la resolución del Vision Pro con un 28% más de píxeles y casi duplica la nitidez del Pimax Crystal original, que ya es un impresionante casco de realidad virtual.

Leer más