Skip to main content
  1. Casa
  2. Computación
  3. Guías
  4. How tos

VASA-1: cómo usar la impresionante herramienta de video de Microsoft

vasa 1 microsoft como usar herramienta ia video
Imagen utilizada con permiso del titular de los derechos de autor

Una increíble nueva herramienta de IA generativa acaba de lanzar Microsoft, se trata de VASA-1,  un modelo de imagen a vídeo, que a partir de una sola imagen y un clip de audio, puede generar imágenes sorprendentemente realistas, con movimientos y expresiones de labios realistas.

Imagen utilizada con permiso del titular de los derechos de autor

“Presentamos VASA, un marco para generar rostros parlantes realistas de personajes virtuales con atractivas habilidades visuales afectivas (VAS), dada una única imagen estática y un clip de audio de habla. Nuestro primer modelo, VASA-1, es capaz no sólo de producir movimientos labiales exquisitamente sincronizados con el audio, sino también de capturar un amplio espectro de matices faciales y movimientos naturales de la cabeza que contribuyen a la percepción de autenticidad y vivacidad. Las principales innovaciones incluyen un modelo holístico de generación de dinámicas faciales y movimientos de la cabeza que funciona en un espacio latente facial, y el desarrollo de dicho espacio latente facial expresivo y desentrañado utilizando vídeos. Mediante experimentos exhaustivos que incluyen la evaluación con un conjunto de nuevas métricas, demostramos que nuestro método supera significativamente a los anteriores en varias dimensiones de forma exhaustiva. Nuestro método no sólo ofrece una alta calidad de vídeo con una dinámica facial y de la cabeza realista, sino que también permite la generación en línea de vídeos de 512×512 a una velocidad de hasta 40 FPS con una latencia inicial insignificante. Esto allana el camino para interactuar en tiempo real con avatares realistas que emulan los comportamientos conversacionales humanos”, señala Microsoft.

VASA-1: Microsoft Strikes Again - STUNNING lifelike AI video and audio from a single photograph

Cómo usar VASA-1

VASA-1 tienen la capacidad de manipular varios aspectos del vídeo generado, como la dirección de la mirada del personaje, la distancia percibida y el estado emocional; todo ello permite personalizar los videos para adaptarlos a necesidades específicas o efectos deseados.

Recommended Videos

Para eso, se sube una fotografía al programa, luego se añade una instrucción y un discurso de audio que se sube al sistema, se genera el video y se puede manejar la mirada, el estado de la persona, la velocidad de las palabras.

Imagen utilizada con permiso del titular de los derechos de autor
Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
¿Planeas actualizar el PC? HP advierte de precios más altos en el futuro
HP Desktop

¿Qué ha pasado? Si planeas comprar un PC, quizá quieras hacerlo cuanto antes. HP afirma que es probable que los precios de los PC y portátiles suban el próximo año porque los costes de los chips de memoria se han disparado. En una reciente conferencia de resultados, el CEO de HP, Enrique Lores, advirtió que, debido al rápido aumento de los precios de la RAM, los futuros productos de PC podrían enviarse con menos memoria o costar más, dependiendo de las condiciones del mercado.

Según PCMag, los precios de la memoria DDR5 han subido más de un 200% en las últimas semanas.

Leer más
¿Pensabas que 8GB de VRAM era malo?
NVIDIA

¿Qué ha pasado? A principios de este año, informes sugerían que las GPUs de próxima generación de Nvidia podrían venir con importantes mejoras de la VRAM. Pero en solo unos meses, el auge de la IA ha elevado tanto los precios de la RAM como de la GDDR al estratosfera, hasta el punto de que, según se informa, AMD y Nvidia están considerando eliminar por completo las GPUs de entrada y económicas. Ahora, las cosas pueden estar complicándose aún más. Ante una creciente escasez global de memoria, se rumorea que Nvidia está cambiando su forma de suministrar GPUs. En lugar de enviar placas completamente pobladas (die + VRAM), puede empezar a enviar solo el chip de la GPU, dejando a los socios de la placa la capacidad de buscar GDDR o HBM por su cuenta. Y si eso ocurre, podría afectar seriamente la flexibilidad de los proveedores y cuántas cartas llegarán realmente a las estanterías.

El paquete de actualización Golden Pig de Leakster afirma que Nvidia dejará de incluir la VRAM con sus GPUs para proteger las cadenas de suministro y reducir los costes iniciales.

Leer más
No te preocupes, tu estrés de compras navideñas ahora lo gestionará la IA
Apps de Amigo Secreto: el intercambio de regalos más sencillo.

Si alguna vez has sentido que tu tensión arterial se dispare solo de pensar en las compras navideñas, no estás solo. La carrera por encontrar el regalo perfecto al precio más bajo suele implicar abrir 50 pestañas del navegador y rezar para que no te hayas perdido ningún código de descuento.

Pero justo a tiempo para la avalancha del Black Friday, dos grandes actores tecnológicos – Microsoft y Perplexity AI – intervienen para gestionar el estrés por ti.

Leer más