Skip to main content

DT en Español podría recibir una comisión si compras un producto desde el sitio

Emu Video: Meta presenta su IA generativa para hacer películas

Un emu dirigiendo una película
Digital Trends Español

La gente de Meta quiere profundizar en la IA generativa en video y aunque no es un tema nuevo, ahora con Emu Video busca profesionalizar los clips de películas, sobre todo para acceso fácil en plataformas de redes sociales como Instagram y Facebook.

«La tecnología de Emu es la base de muchas de nuestras experiencias de IA generativa, algunas herramientas de edición de imágenes de IA para Instagram que te permiten tomar una foto y cambiar su estilo visual o fondo, y la función Imagine dentro de Meta AI que te permite generar imágenes fotorrealistas directamente en mensajes con ese asistente o en chats grupales en nuestra familia de aplicaciones. Nuestro trabajo en este apasionante campo está en curso, y hoy anunciamos una nueva investigación sobre la edición controlada de imágenes basada únicamente en instrucciones de texto y un método para la generación de texto a vídeo basado en modelos de difusión», comienza anunciando la gente de Meta.

Los clips de Emu Video de 512×512 y 16 fotogramas por segundo se pueden editar con un modelo de IA complementario llamado Emu Edit, que también se anunció hoy. Los usuarios pueden describir las modificaciones que desean realizar en Emu Edit en lenguaje natural, por ejemplo, «el mismo clip, pero en cámara lenta», y ver los cambios reflejados en un video recién generado.

Meta señala que, Emu Video «se trata de una arquitectura unificada para tareas de generación de vídeo que puede responder a una variedad de entradas: solo texto, solo imagen y texto e imagen. Hemos dividido el proceso en dos pasos: primero, generar imágenes condicionadas a un mensaje de texto y, a continuación, generar vídeo condicionado tanto al texto como a la imagen generada. Este enfoque «factorizado» o dividido para la generación de vídeo nos permite entrenar modelos de generación de vídeo de forma eficiente. Demostramos que la generación de video factorizado se puede implementar a través de un único modelo de difusión. Presentamos decisiones de diseño críticas, como el ajuste de los programas de ruido para la difusión de video, y capacitación de varias etapas que nos permite generar directamente videos de mayor resolución».

Emu Edit es capaz de editar de forma libre a través de instrucciones, abarcando tareas como la edición local y global, la eliminación y adición de un fondo, las transformaciones de color y geometría, la detección y segmentación, y más.

Recomendaciones del editor

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Intel usa IA para que la batería de su computadora dure más
intel meteor lake ia

Intel
Se espera que los próximos procesadores de escritorio de 14ª generación de Intel sean una actualización menor, lo cual es un poco decepcionante. Por otro lado, la serie móvil se perfila como bastante emocionante. Durante la conferencia Hot Chips de este año en la Universidad de Stanford, los ejecutivos de Intel confirmaron que la próxima serie Meteor Lake de 14ª generación será impulsada por IA.

Los chips de Meteor Lake podrán hacer uso de la IA para administrar la energía y la transición entre los estados activos y de baja potencia, según la información compartida por PCWorld. La compañía lo llama la "Arquitectura de eficiencia energética de Intel" y se puede esperar que el esquema de energía basado en IA se abra camino en futuros productos, incluidos sus próximos procesadores de cliente.

Leer más
Google Cloud presenta nuevas soluciones de IA generativa
google cloud presenta soluciones ia generativa

En el marco del evento Next ‘23,  Google Cloud anunció una serie de innovaciones entre ellas: la disponibilidad de PaLM 2 en español a través de Vertex AI para todos sus clientes, acceso a Duet AI en Workspace para todos los usuarios y la próxima disponibilidad general de Duet AI otros productos de Google Cloud antes de final del año.  Así mismo, presenta una serie de innovaciones en otras áreas, nuevos casos de uso con clientes y partners para acercar a diferentes tipos de empresas, negocios y usuarios los beneficios de la inteligencia artificial generativa y tecnologías de la nube.

“En Google Cloud contamos con un extenso camino recorrido integrando la inteligencia artificial a nuestras soluciones y productos. Hoy, marca un nuevo hito en ese camino y es muy emocionante pensar las posibilidades que se abren a partir de estas innovaciones. En América Latina, la nube es un democratizador que permite que organizaciones de todos los tamaños e industrias accedan a tecnologías de punta, como la IA generativa, para acelerar sus capacidades digitales.” expresa Eduardo López, presidente de Google Cloud para Latinoamérica.
Entrena modelos de IA desde una sola plataforma
El avance de la inteligencia artificial y su revolucionario alcance hacen que la infraestructura deba ser cada vez más sofisticada y con mejores capacidades. En este sentido, Google Cloud anuncia avances clave para sus clientes como Cloud TPUv5e. Un acelerador escalable, versátil y de mayor eficiencia en costo beneficio para ofrecer una plataforma para ejecutar inferencias y entrenamiento de inteligencia artificial a gran escala. En comparación con Cloud TPU v4, proporciona una mejora de hasta 2 veces en el rendimiento del entrenamiento por dólar y una mejora de hasta 2,5 veces en el rendimiento por dólar.
Aplicaciones de inteligencia artificial: ahora en español con Vertex AI
En línea con la infraestructura de primer nivel que ofrece Google Cloud, la plataforma Vertex AI permite crear, desplegar y escalar modelos de aprendizaje automático. A través de esta plataforma los clientes tienen acceso a más de 100 modelos básicos, incluidos código abierto, códigos de terceros y  modelos específicos, como Sec-PaLM 2 para ciberseguridad y Med-PaLM 2 para la industria de salud. A partir de hoy PaLM 2  en español  estará disponible de manera general para todos los clientes de Google Cloud.

Leer más
Meta debuta con Code Llama: su herramienta de escritura de código IA
Crea presentaciones usando la IA con estas 3 herramientas.

Siguiendo con su incursión en IA, Meta presentó su Code Llama, su nueva herramienta de escritura de código. Utilizará la misma licencia comunitaria que Llama 2 y es gratuito para investigación y uso comercial.
Code Llama, dijo Meta, puede crear cadenas de código a partir de mensajes o completar y depurar código cuando se apunta a una cadena de código específica. Además del modelo base de Code Llama, Meta lanzó una versión especializada en Python llamada Code Llama-Python y otra versión llamada Code Llama-Instrct, que puede entender instrucciones en lenguaje natural. Según Meta, cada versión específica de Code Llama no es intercambiable, y la compañía no recomienda el Code Llama base o Code Llama-Python para instrucciones en lenguaje natural.

"Los programadores ya están utilizando LLM para ayudar en una variedad de tareas, que van desde escribir nuevo software hasta depurar el código existente", dijo Meta en una publicación de blog. "El objetivo es hacer que los flujos de trabajo de los desarrolladores sean más eficientes para que puedan centrarse en los aspectos más centrados en el ser humano de sus trabajos".
La compañía dijo que Code Llama obtuvo un 53,7 por ciento en el punto de referencia de código HumanEval y pudo escribir con precisión código basado en una descripción de texto.
Meta lanzará tres tamaños de Code Llama y dijo que su tamaño más pequeño cabe en una sola GPU para proyectos de baja latencia.

Leer más