Skip to main content

VASA-1: cómo usar la impresionante herramienta de video de Microsoft

Una increíble nueva herramienta de IA generativa acaba de lanzar Microsoft, se trata de VASA-1,  un modelo de imagen a vídeo, que a partir de una sola imagen y un clip de audio, puede generar imágenes sorprendentemente realistas, con movimientos y expresiones de labios realistas.

Imagen utilizada con permiso del titular de los derechos de autor

«Presentamos VASA, un marco para generar rostros parlantes realistas de personajes virtuales con atractivas habilidades visuales afectivas (VAS), dada una única imagen estática y un clip de audio de habla. Nuestro primer modelo, VASA-1, es capaz no sólo de producir movimientos labiales exquisitamente sincronizados con el audio, sino también de capturar un amplio espectro de matices faciales y movimientos naturales de la cabeza que contribuyen a la percepción de autenticidad y vivacidad. Las principales innovaciones incluyen un modelo holístico de generación de dinámicas faciales y movimientos de la cabeza que funciona en un espacio latente facial, y el desarrollo de dicho espacio latente facial expresivo y desentrañado utilizando vídeos. Mediante experimentos exhaustivos que incluyen la evaluación con un conjunto de nuevas métricas, demostramos que nuestro método supera significativamente a los anteriores en varias dimensiones de forma exhaustiva. Nuestro método no sólo ofrece una alta calidad de vídeo con una dinámica facial y de la cabeza realista, sino que también permite la generación en línea de vídeos de 512×512 a una velocidad de hasta 40 FPS con una latencia inicial insignificante. Esto allana el camino para interactuar en tiempo real con avatares realistas que emulan los comportamientos conversacionales humanos», señala Microsoft.

VASA-1: Microsoft Strikes Again - STUNNING lifelike AI video and audio from a single photograph

Cómo usar VASA-1

VASA-1 tienen la capacidad de manipular varios aspectos del vídeo generado, como la dirección de la mirada del personaje, la distancia percibida y el estado emocional; todo ello permite personalizar los videos para adaptarlos a necesidades específicas o efectos deseados.

Para eso, se sube una fotografía al programa, luego se añade una instrucción y un discurso de audio que se sube al sistema, se genera el video y se puede manejar la mirada, el estado de la persona, la velocidad de las palabras.

Imagen utilizada con permiso del titular de los derechos de autor

Recomendaciones del editor

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Microsoft lanzará ChatGPT 4 con videos de IA la próxima semana
Microsoft Bing y Edge con ChatGPT: cómo conseguirlos.

ChatGPT ha sido ineludible en los últimos meses, y parece que Microsoft está a punto de actualizar la herramienta de IA con una actualización que podría ponerla en el centro de atención una vez más. Esto se debe a que la compañía está lista para lanzar GPT-4 la próxima semana, y potencialmente le permitirá crear videos generados por IA a partir de simples indicaciones de texto.

La noticia fue revelada por Andreas Braun, Director de Tecnología de Microsoft Alemania, en un evento reciente titulado "AI in Focus - Digital Kickoff" (a través de Heise). Según Braun, "Presentaremos GPT-4 la próxima semana ... Tendremos modelos multimodales que ofrecerán posibilidades completamente diferentes, por ejemplo, videos".

Leer más
Microsoft Edge ahora tiene 1GB de VPN gratis
Cómo descargar Microsoft Office gratis (ahora Microsoft 365).

Una buena noticia están recibiendo todos los usuarios de Microsoft Edge y es un buen argumento también para aquellos que quieran migrarse a este navegador, ya que comenzó a ofrecer una VPN gratis de 1GB de almacenamiento.

Esta novedad ha empezado a llegar al canal estable, donde algunos usuarios ya han podido verla dentro del navegador, en los ajustes de Privacidad. Su finalidad es la de proteger la navegación del usuario especialmente cuando se conecta a una WiFi publica, insegura o sin un certificado válido como HTTPS.

Leer más
Microsoft incluirá la IA de ChatGPT en Bing y en su navegador Edge
Microsoft incluirá la IA de ChatGPT en Bing y su navegador Edge.

Microsoft ha decidido renovar su motor de búsqueda Bing y su navegador web Edge con inteligencia artificial, en un claro intento de retomar el liderazgo que ha estado en manos de otras tecnológicas.

Esta vez se está apostando al futuro a la inteligencia artificial con una ficha de miles de millones de dólares y desafiando directamente a Google, que durante lustros la ha superado en tecnología de búsqueda y navegación.

Leer más