Skip to main content

DT en Español podría recibir una comisión si compras un producto desde el sitio

Emu Video: Meta presenta su IA generativa para hacer películas

Un emu dirigiendo una película
Digital Trends Español

La gente de Meta quiere profundizar en la IA generativa en video y aunque no es un tema nuevo, ahora con Emu Video busca profesionalizar los clips de películas, sobre todo para acceso fácil en plataformas de redes sociales como Instagram y Facebook.

«La tecnología de Emu es la base de muchas de nuestras experiencias de IA generativa, algunas herramientas de edición de imágenes de IA para Instagram que te permiten tomar una foto y cambiar su estilo visual o fondo, y la función Imagine dentro de Meta AI que te permite generar imágenes fotorrealistas directamente en mensajes con ese asistente o en chats grupales en nuestra familia de aplicaciones. Nuestro trabajo en este apasionante campo está en curso, y hoy anunciamos una nueva investigación sobre la edición controlada de imágenes basada únicamente en instrucciones de texto y un método para la generación de texto a vídeo basado en modelos de difusión», comienza anunciando la gente de Meta.

Los clips de Emu Video de 512×512 y 16 fotogramas por segundo se pueden editar con un modelo de IA complementario llamado Emu Edit, que también se anunció hoy. Los usuarios pueden describir las modificaciones que desean realizar en Emu Edit en lenguaje natural, por ejemplo, «el mismo clip, pero en cámara lenta», y ver los cambios reflejados en un video recién generado.

Meta señala que, Emu Video «se trata de una arquitectura unificada para tareas de generación de vídeo que puede responder a una variedad de entradas: solo texto, solo imagen y texto e imagen. Hemos dividido el proceso en dos pasos: primero, generar imágenes condicionadas a un mensaje de texto y, a continuación, generar vídeo condicionado tanto al texto como a la imagen generada. Este enfoque «factorizado» o dividido para la generación de vídeo nos permite entrenar modelos de generación de vídeo de forma eficiente. Demostramos que la generación de video factorizado se puede implementar a través de un único modelo de difusión. Presentamos decisiones de diseño críticas, como el ajuste de los programas de ruido para la difusión de video, y capacitación de varias etapas que nos permite generar directamente videos de mayor resolución».

Emu Edit es capaz de editar de forma libre a través de instrucciones, abarcando tareas como la edición local y global, la eliminación y adición de un fondo, las transformaciones de color y geometría, la detección y segmentación, y más.

Recomendaciones del editor

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Windows 11 pronto aprovechará su GPU para la IA generativa
Windows 11 vs. Windows 10: ¿deberías actualizarte?

Tras la introducción de Copilot, su último asistente inteligente para Windows 11, Microsoft vuelve a avanzar en la integración de la IA generativa con Windows. En la conferencia de desarrolladores Ignite 2023 en curso en Seattle, la compañía anunció una asociación con Nvidia en TensorRT-LLM que promete elevar las experiencias de los usuarios en computadoras de escritorio y portátiles con Windows con GPU RTX.

La nueva versión está configurada para introducir soporte para nuevos modelos de lenguaje grandes, lo que hace que las cargas de trabajo de IA exigentes sean más accesibles. Cabe destacar su compatibilidad con la API de chat de OpenAI, que permite la ejecución local (en lugar de en la nube) en PC y estaciones de trabajo con GPU RTX a partir de 8 GB de VRAM.

Leer más
Youtube podrá matar la música generada por IA
youtube matar musica generada ia 3f3ee4ce 01d2 4949 96ed f16c88181c14

La irrupción hace unos días de un usuario virtual que generó una canción con la voz del puertorriqueño Bad Bunny, ha vuelto a poner en el tapete la discusión y posible regulación de la IA en el mundo de la música. Y ahora Youtube es quien quiere poner cartas en el asunto, con una herramienta para marcar este contenido en la plataforma.

Las compañías discográficas pueden solicitar la eliminación de las canciones que utilizan versiones generadas por inteligencia artificial de las voces de los artistas según las nuevas directrices emitidas por YouTube.
La plataforma, propiedad de Google, dijo en una publicación de blog que probaría los nuevos controles con un grupo selecto de sellos y distribuidores antes de un lanzamiento más amplio.

Leer más
NVIDIA anuncia su generación de chips de supercomputadora de IA
nvidia chips supercomputadora ia grace hopper gh200 gh 200

La gente de NVIDIA ha presentado este lunes 13 de noviembre su nueva generación de chips de supercomputadora IA, los GPU HGX H200 de la serie arquitectura Hopper y que  desempeñarán un papel importante en futuros avances en aprendizaje profundo y grandes modelos de lenguaje (LLM) como GPT-4 de OpenAI.

Estos chips están pensados para centros de datos y supercomputadoras, trabajando en tareas como la predicción del tiempo y el clima, el descubrimiento de fármacos, la computación cuántica y más.

Leer más