Skip to main content
  1. Home
  2. Computación
  3. Noticias
  4. Redes sociales
  5. News

DT en Español podría recibir una comisión si compras un producto desde el sitio

Emu Video: Meta presenta su IA generativa para hacer películas

Add as a preferred source on Google
Un emu dirigiendo una película
Digital Trends Español

La gente de Meta quiere profundizar en la IA generativa en video y aunque no es un tema nuevo, ahora con Emu Video busca profesionalizar los clips de películas, sobre todo para acceso fácil en plataformas de redes sociales como Instagram y Facebook.

«La tecnología de Emu es la base de muchas de nuestras experiencias de IA generativa, algunas herramientas de edición de imágenes de IA para Instagram que te permiten tomar una foto y cambiar su estilo visual o fondo, y la función Imagine dentro de Meta AI que te permite generar imágenes fotorrealistas directamente en mensajes con ese asistente o en chats grupales en nuestra familia de aplicaciones. Nuestro trabajo en este apasionante campo está en curso, y hoy anunciamos una nueva investigación sobre la edición controlada de imágenes basada únicamente en instrucciones de texto y un método para la generación de texto a vídeo basado en modelos de difusión», comienza anunciando la gente de Meta.

Los clips de Emu Video de 512×512 y 16 fotogramas por segundo se pueden editar con un modelo de IA complementario llamado Emu Edit, que también se anunció hoy. Los usuarios pueden describir las modificaciones que desean realizar en Emu Edit en lenguaje natural, por ejemplo, «el mismo clip, pero en cámara lenta», y ver los cambios reflejados en un video recién generado.

Recommended Videos

Meta señala que, Emu Video «se trata de una arquitectura unificada para tareas de generación de vídeo que puede responder a una variedad de entradas: solo texto, solo imagen y texto e imagen. Hemos dividido el proceso en dos pasos: primero, generar imágenes condicionadas a un mensaje de texto y, a continuación, generar vídeo condicionado tanto al texto como a la imagen generada. Este enfoque «factorizado» o dividido para la generación de vídeo nos permite entrenar modelos de generación de vídeo de forma eficiente. Demostramos que la generación de video factorizado se puede implementar a través de un único modelo de difusión. Presentamos decisiones de diseño críticas, como el ajuste de los programas de ruido para la difusión de video, y capacitación de varias etapas que nos permite generar directamente videos de mayor resolución».

Emu Edit es capaz de editar de forma libre a través de instrucciones, abarcando tareas como la edición local y global, la eliminación y adición de un fondo, las transformaciones de color y geometría, la detección y segmentación, y más.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Wikipedia 25 años: contra todo somos la columna vertebral del conocimiento
Wikipedia en español

Wikipedia, la mayor enciclopedia colaborativa en la historia de Internet, celebra hoy su vigésimo quinto aniversario desde su fundación el 15 de enero de 2001. Para conmemorar este significativo logro, la Fundación Wikimedia ha lanzado una campaña global denominada "Wikipedia25" bajo el lema "El conocimiento es humano", enfatizando el valor fundamental de la contribución humana en la era de la inteligencia artificial.

A lo largo de sus dos décadas y media de existencia, Wikipedia ha evolucionado desde cuatro artículos iniciales hasta un colosal repositorio que contiene más de 65 millones de artículos distribuidos en más de 300 idiomas, con un promedio de 15.000 millones de visitas mensuales. Este crecimiento extraordinario ha sido posible gracias a una comunidad global de aproximadamente 250.000 editores voluntarios que mensualmente dedican su tiempo y conocimiento a crear, verificar y mantener contenidos bajo rigurosos estándares de neutralidad y confiabilidad.

Read more
El truco supuestamente infalible para mejorar tus prompts en chatbots
ChatGPT

Si tu asistente de IA sigue dejando de lado detalles o hablando más allá de la pregunta, no necesitas un modelo nuevo para obtener mejores resultados. Pequeños cambios en mejores prompts de chatbot pueden limpiar gran parte del desastre.

Una solución es mecánica. Un artículo de investigación de Google destacado por VentureBeat señala un movimiento muy sencillo: pegar tu petición exacta dos veces en el mismo mensaje. Está pensado para aumentar la precisión en trabajos sencillos como la extracción, respuestas cortas y reescritura básica, no en razonamientos largos y de varios pasos.

Read more
ChatGPT Translate: más para reescribir que para traducir literalmente
Page, Text, Electronics

ChatGPT Translate es ahora una página de traducción independiente, y está dirigida directamente al hábito que la mayoría ya tenemos: pegar texto, obtener un resultado rápido y seguir adelante. OpenAI no ha tenido un gran lanzamiento público al respecto, pero la herramienta está activa y soporta traducciones hacia y desde más de 50 idiomas con detección automática de idiomas.

Pero lo que viene después es lo que lo distingue.

Read more