Skip to main content
  1. Home
  2. Realidad Virtual
  3. Noticias
  4. News

DT en Español podría recibir una comisión si compras un producto desde el sitio

Esta IA puede falsificar tu voz después de solo tres segundos

La inteligencia artificial (IA) está teniendo un momento ahora, y el viento continúa soplando en sus velas con la noticia de que Microsoft está trabajando en una IA que puede imitar la voz de cualquiera después de haber sido alimentado con una breve muestra de tres segundos.

La nueva herramienta, denominada VALL-E, ha sido entrenada en aproximadamente 60.000 horas de datos de voz en inglés, que Microsoft dice que es «cientos de veces más grande que los sistemas existentes». Usando ese conocimiento, sus creadores afirman que solo necesita un poco de información vocal para comprender cómo replicar la voz de un usuario.

Hombre hablando por teléfono
Fizkes/Shutterstock

Más impresionante, VALL-E puede reproducir las emociones, los tonos vocales y el entorno acústico que se encuentran en cada muestra, algo con lo que otros programas de IA de voz han luchado. Eso le da un aura más realista y acerca sus resultados a algo que podría pasar como un discurso humano genuino.

En comparación con otros competidores de texto a voz (TTS), Microsoft dice que VALL-E «supera significativamente al sistema TTS de disparo cero de última generación en términos de naturalidad del habla y similitud del altavoz». En otras palabras, VALL-E suena mucho más como humanos reales que como IA rivales que encuentran entradas de audio en las que no han sido entrenados.

En GitHub, Microsoft ha creado una pequeña biblioteca de ejemplos creados con VALL-E. Los resultados son en su mayoría muy impresionantes, con muchas muestras que reproducen el tono y el acento de las voces de los oradores. Algunos de los ejemplos son menos convincentes, lo que indica que VALL-E probablemente no sea un producto terminado, pero en general el resultado es convincente.

Enorme potencial y riesgos

Una persona que realiza una videollamada en un dispositivo Microsoft Surface que ejecuta Windows 11.
Microsoft/Unsplash

En un documento que presenta VALL-E, Microsoft explica que VALL-E «puede conllevar riesgos potenciales en el mal uso del modelo, como falsificar la identificación de voz o hacerse pasar por un altavoz específico». Una herramienta tan capaz de generar un discurso que suene realista plantea el espectro de deepfakes cada vez más convincentes, que podrían usarse para imitar cualquier cosa, desde una ex pareja romántica hasta una personalidad internacional prominente.

Para mitigar esa amenaza, Microsoft dice que «es posible construir un modelo de detección para discriminar si un clip de audio fue sintetizado por VALL-E». La compañía dice que también utilizará sus propios principios de IA al desarrollar su trabajo. Esos principios abarcan esferas como la equidad, la seguridad, la privacidad y la rendición de cuentas.

VALL-E es solo el último ejemplo de la experimentación de Microsoft con la IA. Recientemente, la compañía ha estado trabajando en la integración de ChatGPT en Bing, utilizando IA para recapitular sus reuniones de Teams e injertando herramientas avanzadas en aplicaciones como Outlook, Word y PowerPoint. Y según Semafor, Microsoft está buscando invertir $ 10 mil millones en el fabricante de ChatGPT OpenAI, una compañía en la que ya ha invertido fondos significativos.

A pesar de los riesgos aparentes, herramientas como VALL-E podrían ser especialmente útiles en medicina, por ejemplo, para ayudar a las personas a recuperar su voz después de un accidente. Ser capaz de replicar el habla con un conjunto de entradas tan pequeño podría ser inmensamente prometedor en estas situaciones, siempre que se haga bien. Pero con todo el dinero que se gasta en IA, tanto por Microsoft como por otros, está claro que no va a desaparecer pronto.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
El Meta Quest 3S es oficial: realidad mixta aún más asequible
meta quest 3s

En Meta Connect 2024, la compañía anunció oficialmente el anticipado Quest 3S, un auricular de realidad virtual de $ 300 con muchas de las mejores características del Quest 3 más caro que se lanzó el año pasado. Si bien el Quest 3 es un mejor auricular en general, el modelo económico puede ejecutar los mismos juegos de realidad mixta, aplicaciones y títulos de realidad virtual inmersivos.
Meta le dio al Quest 3S un potente chip Qualcomm Snapdragon XR2 Gen 2, el mejor disponible en cualquier auricular Meta VR. Es por eso que puede manejar grandes títulos como Batman: Arkham Shadow y Asgard's Wrath 2. Si compras un Quest 3S durante el período promocional, Arkham Shadow es gratis.
Meta
También tiene controladores Touch Plus sin los anillos voluminosos de los controladores del Quest 2. Si está actualizando desde un auricular de realidad virtual más antiguo, disfrutará de más libertad de movimiento sin preocuparse por el choque de anillos al dibujar un arco virtual o poner la guardia en el boxeo virtual.

El Quest 3S también tiene el mismo seguimiento de manos y compatibilidad con el controlador que el Quest 3. En el sistema operativo Horizon de Meta y en un número cada vez mayor de juegos y aplicaciones, simplemente puede usar sus manos para extender y tocar los controles virtuales como si fueran reales.
Meta Quest 3S parece que tiene una buena calidad de realidad mixta. Meta
Abra el navegador para ver tres tabletas gigantes flotando a su alrededor. Toque una ventana para hacer clic, navegar y desplazarse. Un Meta Quest 3S podría reemplazar tu tableta. Obtienes privacidad automática, pero compartir la pantalla con otra persona no es tan fácil.

Read more
Meta lanza su propia versión del modo de voz avanzado en Connect 2024
meta modo voz avanzado connect 2024

En Meta Connect 2024 el miércoles, el CEO Mark Zuckerberg subió al escenario para discutir los últimos avances de su compañía en inteligencia artificial. En lo que describe como "probablemente la mayor noticia de IA que tenemos", Zuckerberg dio a conocer Natural Voice Interactions, un competidor directo de Gemini Live de Google y Advanced Voice Mode de OpenAI.

"Creo que la voz va a ser una forma mucho más natural de interactuar con la IA que el texto", comentó Zuckerberg. "Creo que tiene el potencial de ser una de las formas, si no la más frecuente, en que todos interactuamos con la IA". Zuckerberg también anunció que la nueva función comenzará a implementarse para los usuarios hoy en todas las principales aplicaciones de Meta, incluidas Instagram, WhatsApp, Messenger y Facebook.
Meta
"Meta AI se diferencia en esta categoría no solo por ofrecer modelos de IA de última generación, sino también por el acceso ilimitado a esos modelos para una integración gratuita y fácil en nuestros diferentes productos y aplicaciones", dijo Zuckerberg. "Meta AI está en camino de ser el asistente de IA más utilizado en el mundo. Estamos casi en 500 millones de activos mensuales y aún no hemos lanzado en algunos de los países más grandes".

Read more
Meta presenta sus lentes de realidad aumentada de primer nivel: Orion
meta lentes orion

En el Meta Connect 2024, Mark Zuckerberg tenía escondido un as bajo la manga, sus primeros lentes de realidad aumentada llamados Orion.

"Hemos acercado ese sueño a la realidad con la presentación de Orion, que creemos que son las gafas de RA más avanzadas jamás fabricadas. De hecho, puede que sea el dispositivo electrónico de consumo más desafiante fabricado desde el smartphone. Orion es el resultado de invenciones revolucionarias en prácticamente todos los campos de la informática moderna, basadas en el trabajo que hemos venido realizando en Reality Labs durante la última década. Está repleto de tecnologías completamente nuevas, como la pantalla de realidad aumentada más avanzada jamás ensamblada y un silicio personalizado que permite ejecutar potentes experiencias de realidad aumentada en unas gafas con una fracción de la potencia y el peso de un casco de realidad aumentada", dijeron en Meta sobre esta innovación para tus ojos y sentidos.

Read more