Skip to main content

DT en Español podría recibir una comisión si compras un producto desde el sitio

Emu Video: Meta presenta su IA generativa para hacer películas

Un emu dirigiendo una película
Digital Trends Español

La gente de Meta quiere profundizar en la IA generativa en video y aunque no es un tema nuevo, ahora con Emu Video busca profesionalizar los clips de películas, sobre todo para acceso fácil en plataformas de redes sociales como Instagram y Facebook.

«La tecnología de Emu es la base de muchas de nuestras experiencias de IA generativa, algunas herramientas de edición de imágenes de IA para Instagram que te permiten tomar una foto y cambiar su estilo visual o fondo, y la función Imagine dentro de Meta AI que te permite generar imágenes fotorrealistas directamente en mensajes con ese asistente o en chats grupales en nuestra familia de aplicaciones. Nuestro trabajo en este apasionante campo está en curso, y hoy anunciamos una nueva investigación sobre la edición controlada de imágenes basada únicamente en instrucciones de texto y un método para la generación de texto a vídeo basado en modelos de difusión», comienza anunciando la gente de Meta.

Los clips de Emu Video de 512×512 y 16 fotogramas por segundo se pueden editar con un modelo de IA complementario llamado Emu Edit, que también se anunció hoy. Los usuarios pueden describir las modificaciones que desean realizar en Emu Edit en lenguaje natural, por ejemplo, «el mismo clip, pero en cámara lenta», y ver los cambios reflejados en un video recién generado.

Meta señala que, Emu Video «se trata de una arquitectura unificada para tareas de generación de vídeo que puede responder a una variedad de entradas: solo texto, solo imagen y texto e imagen. Hemos dividido el proceso en dos pasos: primero, generar imágenes condicionadas a un mensaje de texto y, a continuación, generar vídeo condicionado tanto al texto como a la imagen generada. Este enfoque «factorizado» o dividido para la generación de vídeo nos permite entrenar modelos de generación de vídeo de forma eficiente. Demostramos que la generación de video factorizado se puede implementar a través de un único modelo de difusión. Presentamos decisiones de diseño críticas, como el ajuste de los programas de ruido para la difusión de video, y capacitación de varias etapas que nos permite generar directamente videos de mayor resolución».

Emu Edit es capaz de editar de forma libre a través de instrucciones, abarcando tareas como la edición local y global, la eliminación y adición de un fondo, las transformaciones de color y geometría, la detección y segmentación, y más.

Recomendaciones del editor

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
La IA está a punto de cambiar la producción de vídeo para siempre
ia a punto cambiar produccion video para siempre adobe premiere pro

Adobe
La IA generativa está empezando a irrumpir en el mundo del vídeo, pero algunas funciones nuevas de Premiere Pro están llevando las cosas al siguiente nivel. Adobe ha anunciado una serie de herramientas de vídeo de IA generativa que introducirá en la suite de edición de vídeo Premiere Pro a lo largo del año, y tienen un aspecto bastante increíble.

La marca está trabajando para expandir su propio modelo de IA, Adobe Firefly, que comenzó como un generador de texto a imagen en marzo pasado y ha expandido rápidamente su marca de IA a través de varios medios de edición.

Leer más
WhatsApp ya está probando su propio chatbot de IA
whatsapp crear stickers android

Una nueva función está probando en formato beta y solo en inglés y solo para algunos usuarios seleccionados de iOS y Android, la plataforma WhatsApp. Se trata de un chatbot de inteligencia artificial.

Meta ahora está probando la adición del chatbot Meta AI al servicio de mensajería, una prueba que actualmente se está llevando a cabo dentro de la última versión de la aplicación.

Leer más
OpenAI necesita solo 15 segundos de audio para que su IA clone una voz
Mujer está sosteniendo su teléfono y haciendo una grabación de voz al interior de una casa.

En los últimos años, el tiempo de escucha requerido por una pieza de IA para clonar la voz de alguien se ha ido acortando cada vez más. Antes eran minutos, ahora son solo segundos.

OpenAI, la compañía respaldada por Microsoft detrás del chatbot viral de IA generativa ChatGPT, reveló recientemente que su propia tecnología de clonación de voz requiere solo 15 segundos de material de audio para reproducir la voz de alguien.

Leer más