Skip to main content

DT en Español podría recibir una comisión si compras un producto desde el sitio

Emu Video: Meta presenta su IA generativa para hacer películas

Un emu dirigiendo una película
Digital Trends Español

La gente de Meta quiere profundizar en la IA generativa en video y aunque no es un tema nuevo, ahora con Emu Video busca profesionalizar los clips de películas, sobre todo para acceso fácil en plataformas de redes sociales como Instagram y Facebook.

«La tecnología de Emu es la base de muchas de nuestras experiencias de IA generativa, algunas herramientas de edición de imágenes de IA para Instagram que te permiten tomar una foto y cambiar su estilo visual o fondo, y la función Imagine dentro de Meta AI que te permite generar imágenes fotorrealistas directamente en mensajes con ese asistente o en chats grupales en nuestra familia de aplicaciones. Nuestro trabajo en este apasionante campo está en curso, y hoy anunciamos una nueva investigación sobre la edición controlada de imágenes basada únicamente en instrucciones de texto y un método para la generación de texto a vídeo basado en modelos de difusión», comienza anunciando la gente de Meta.

Los clips de Emu Video de 512×512 y 16 fotogramas por segundo se pueden editar con un modelo de IA complementario llamado Emu Edit, que también se anunció hoy. Los usuarios pueden describir las modificaciones que desean realizar en Emu Edit en lenguaje natural, por ejemplo, «el mismo clip, pero en cámara lenta», y ver los cambios reflejados en un video recién generado.

Recommended Videos

Meta señala que, Emu Video «se trata de una arquitectura unificada para tareas de generación de vídeo que puede responder a una variedad de entradas: solo texto, solo imagen y texto e imagen. Hemos dividido el proceso en dos pasos: primero, generar imágenes condicionadas a un mensaje de texto y, a continuación, generar vídeo condicionado tanto al texto como a la imagen generada. Este enfoque «factorizado» o dividido para la generación de vídeo nos permite entrenar modelos de generación de vídeo de forma eficiente. Demostramos que la generación de video factorizado se puede implementar a través de un único modelo de difusión. Presentamos decisiones de diseño críticas, como el ajuste de los programas de ruido para la difusión de video, y capacitación de varias etapas que nos permite generar directamente videos de mayor resolución».

Emu Edit es capaz de editar de forma libre a través de instrucciones, abarcando tareas como la edición local y global, la eliminación y adición de un fondo, las transformaciones de color y geometría, la detección y segmentación, y más.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Canva tiene nuevo generador de imágenes con IA y más novedades
Canva

La plataforma Canva, herramienta web para edición de imágenes y video, está presentando nuevas funciones de IA. La última adquisición es "Dream Lab", una nueva herramienta generadora de imágenes nacida de la adquisición de la startup de IA generativa Leonardo.ai Canva a principios de este año.
Dream Lab funciona con el modelo Phoenix de Leonardo y permite a los usuarios generar imágenes a partir de descripciones en una variedad de estilos como "renderizado 3D" e "ilustración".
Droptober 2024 | The latest Canva launches, designed for your greatest work

Canva también ha realizado algunas actualizaciones en su conjunto de herramientas de IA "Magic", como una precisión mejorada y comandos de autocompletado con un solo clic para la función de generación de texto Magic Write. Las pizarras ahora admiten resúmenes impulsados por IA y pegatinas de reacción en tiempo real para proyectos colaborativos, y se han agregado herramientas de edición de video que generan subtítulos automáticamente e introducen nuevos efectos de animación.

Leer más
Adobe quiere reinar en la IA de video y agrega capacidades a Firefly
adobe firefly nuevas capacidades ia video

El mundo de la IA generativa y sobre todo lo que tiene que ver con la creación de video a partir de instrucciones, está agarrando nuevos vuelos, ya que este lunes 14 de octubre Adobe presentó actualizaciones y nuevas capacidades de su modelo Firefly, que ya está integrado con Premiere Pro para.

El modelo de video Firefly, como se llama la tecnología, competirá con Sora de OpenAI, que se presentó a principios de este año, mientras que el propietario de TikTok, ByteDance, y Meta Platforms también han anunciado sus herramientas de video en los últimos meses.
Las nuevas características
La primera herramienta, Generative Extend, se lanza en versión beta para Premiere Pro. Se puede utilizar para ampliar el final o el principio de un metraje que es un poco demasiado corto, o hacer ajustes a mitad de la toma, como para corregir cambios en las líneas de los ojos o movimientos inesperados.
Los clips solo se pueden extender dos segundos, por lo que la extensión generativa solo es realmente adecuada para pequeños ajustes, pero eso podría reemplazar la necesidad de volver a tomar el metraje para corregir pequeños problemas. Los clips extendidos se pueden generar a 720p o 1080p a 24 FPS. También se puede usar en audio para ayudar a suavizar las ediciones, aunque con limitaciones. Extenderá los efectos de sonido y el "tono de la habitación" ambiental hasta diez segundos, por ejemplo, pero no los diálogos hablados o la música.

Leer más
Zoom presenta su nueva plataforma centrada en IA
zoom ai companion

Julia M Cameron / Pexels
Zoom presentó su AI Companion 2.0 durante el evento Zoomtopia 2024 de la compañía el miércoles. El asistente de IA está incorporado en todo el conjunto de aplicaciones de Zoom Workplace y promete "ofrecer una plataforma de trabajo centrada en la IA para la conexión humana".

Si bien Zoom comenzó como una aplicación de videoconferencia, la empresa ha ampliado su ecosistema de productos para convertirse en una "plataforma de colaboración abierta" que incluye una variedad de servicios de comunicación, productividad y negocios, tanto en línea como en espacios de oficina físicos. El AI Companion de la compañía, que debutó en septiembre pasado, está profundamente incorporado en Zoom Workplace y, al igual que Gemini de Google o Copilot de Microsoft, está diseñado para automatizar tareas repetitivas como transcribir notas y resumir informes que pueden ocupar hasta el 62% de la jornada laboral de una persona.

Leer más