Skip to main content

DT en Español podría recibir una comisión si compras un producto desde el sitio

Emu Video: Meta presenta su IA generativa para hacer películas

Un emu dirigiendo una película
Digital Trends Español

La gente de Meta quiere profundizar en la IA generativa en video y aunque no es un tema nuevo, ahora con Emu Video busca profesionalizar los clips de películas, sobre todo para acceso fácil en plataformas de redes sociales como Instagram y Facebook.

«La tecnología de Emu es la base de muchas de nuestras experiencias de IA generativa, algunas herramientas de edición de imágenes de IA para Instagram que te permiten tomar una foto y cambiar su estilo visual o fondo, y la función Imagine dentro de Meta AI que te permite generar imágenes fotorrealistas directamente en mensajes con ese asistente o en chats grupales en nuestra familia de aplicaciones. Nuestro trabajo en este apasionante campo está en curso, y hoy anunciamos una nueva investigación sobre la edición controlada de imágenes basada únicamente en instrucciones de texto y un método para la generación de texto a vídeo basado en modelos de difusión», comienza anunciando la gente de Meta.

Los clips de Emu Video de 512×512 y 16 fotogramas por segundo se pueden editar con un modelo de IA complementario llamado Emu Edit, que también se anunció hoy. Los usuarios pueden describir las modificaciones que desean realizar en Emu Edit en lenguaje natural, por ejemplo, «el mismo clip, pero en cámara lenta», y ver los cambios reflejados en un video recién generado.

Meta señala que, Emu Video «se trata de una arquitectura unificada para tareas de generación de vídeo que puede responder a una variedad de entradas: solo texto, solo imagen y texto e imagen. Hemos dividido el proceso en dos pasos: primero, generar imágenes condicionadas a un mensaje de texto y, a continuación, generar vídeo condicionado tanto al texto como a la imagen generada. Este enfoque «factorizado» o dividido para la generación de vídeo nos permite entrenar modelos de generación de vídeo de forma eficiente. Demostramos que la generación de video factorizado se puede implementar a través de un único modelo de difusión. Presentamos decisiones de diseño críticas, como el ajuste de los programas de ruido para la difusión de video, y capacitación de varias etapas que nos permite generar directamente videos de mayor resolución».

Emu Edit es capaz de editar de forma libre a través de instrucciones, abarcando tareas como la edición local y global, la eliminación y adición de un fondo, las transformaciones de color y geometría, la detección y segmentación, y más.

Recomendaciones del editor

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
NVIDIA anuncia su generación de chips de supercomputadora de IA
nvidia chips supercomputadora ia grace hopper gh200 gh 200

La gente de NVIDIA ha presentado este lunes 13 de noviembre su nueva generación de chips de supercomputadora IA, los GPU HGX H200 de la serie arquitectura Hopper y que  desempeñarán un papel importante en futuros avances en aprendizaje profundo y grandes modelos de lenguaje (LLM) como GPT-4 de OpenAI.

Estos chips están pensados para centros de datos y supercomputadoras, trabajando en tareas como la predicción del tiempo y el clima, el descubrimiento de fármacos, la computación cuántica y más.

Leer más
Samsung Gauss: los coreanos presentan su propio ChatGPT
samsung gauss chatgpt

En los días en que OpenAI está en su conferencia anual para contar sus novedades en torno a ChatGPT y todo su sistema de IA, Samsung acaba de anunciar la concreción de su proyecto Samsung Gauss, su propio sistema de IA generativa que puede hacer código, texto e imagen.

Samsung Gauss, desarrollado por la unidad de investigación del gigante tecnológico Samsung Research, consta de tres herramientas: Samsung Gauss Language, Samsung Gauss Code y Samsung Gauss Image.

Leer más
Bill Gates dice que la IA generativa como GPT tocó su techo
bill gates sorprendido

En una entrevista con el periódico económico alemán Handelsblatt, el fundador de Microsoft, Bill Gates, afirmó que según lo que ha observado hasta el momento, la IA generativa como GPT ya llegó a su techo y que no espera, por ejemplo, que GPT-5 tenga diferencias radicales con GPT-4.

El filántropo tecnológico ve un gran potencial en los sistemas de IA actuales si se reducen los costes y las tasas de error y se mejora la fiabilidad, lo que cree que se puede lograr en los próximos dos a cinco años.
GPT-5: por qué no será un gran salto
Como punto de referencia de lo que considera una importante mejora de la calidad, citó el gran salto de calidad de GPT-2 a GPT-4, que describió como "increíble".

Leer más