Skip to main content
  1. Home
  2. Android
  3. Noticias
  4. News

Google contraataca ante Sora de OpenAI con Veo 2

Add as a preferred source on Google
google veo 2 rival sora openai
Imagen utilizada con permiso del titular de los derechos de autor

La división DeepMind de Google presentó el lunes su modelo de generación de video Veo de segunda generación, que puede crear clips de hasta dos minutos de duración y con resoluciones que alcanzan la calidad 4K, es decir, seis veces la duración y cuatro veces la resolución de los clips de 20 segundos / 1080p que Sora puede generar.

Por supuesto, esos son los límites superiores teóricos de Veo 2. Actualmente, el modelo solo está disponible en VideoFX, la plataforma experimental de generación de video de Google, y sus clips tienen un límite de ocho segundos y una resolución de 720p. VideoFX también está en lista de espera, por lo que no cualquiera puede iniciar sesión para probar Veo 2, aunque la compañía anunció que ampliará el acceso en las próximas semanas. Un portavoz de Google también señaló que Veo 2 estará disponible en la plataforma Vertex AI una vez que la compañía pueda escalar suficientemente las capacidades del modelo.

Recommended Videos

«En los próximos meses, continuaremos iterando en función de los comentarios de los usuarios», dijo Eli Collins a TechCrunch, «y buscaremos integrar las capacidades actualizadas de Veo 2 en casos de uso convincentes en todo el ecosistema de Google… Esperamos compartir más actualizaciones el próximo año».

BREAKING: Google just dropped Veo 2 and Imagen 3 — their next gen video and image generation models.

Turns out Google's been closing the gap quietly — not just on LLMs, but on visual creation too.

Here’s everything you need to know w/o the hype 🧵 pic.twitter.com/4BL82HAmEQ

— Bilawal Sidhu (@bilawalsidhu) December 16, 2024

Según se informa, Veo 2 tiene una serie de ventajas sobre sus predecesores, incluida una mejor comprensión de la física (piense en una mejor dinámica de fluidos y mejores efectos de iluminación / sombra), así como la capacidad de generar videoclips «más claros», en el sentido de que las texturas e imágenes generadas son más nítidas y menos propensas a desenfocarse al moverse. El nuevo modelo también ofrece controles de cámara mejorados, lo que permite al usuario posicionar la lente de la cámara virtual con mayor precisión que antes.

Como señala TechCrunch, Veo 2 aún no ha perfeccionado el proceso de generación de video, aunque parece alucinar mucho menos que rivales como Sora, Kling, Movie Gen o Gen 3 Alpha. «La coherencia y la consistencia son áreas de crecimiento», dijo Collins. «Veo puede adherirse consistentemente a una indicación durante un par de minutos, pero no puede adherirse a indicaciones complejas en horizontes largos. Del mismo modo, la consistencia de los personajes puede ser un desafío. También hay espacio para mejorar en la generación de detalles intrincados, movimientos rápidos y complejos, y continuar ampliando los límites del realismo».

Google también anunció mejoras en Imagen 3 el lunes, lo que permite que el modelo de generación de imágenes comerciales cree resultados «más brillantes y mejor compuestos». El modelo, disponible en ImageFX, también ofrecerá sugerencias descriptivas adicionales basadas en palabras clave en el mensaje del usuario, y cada palabra clave generará un menú desplegable de términos relacionados.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
NotebookLM lleva sus resúmenes en video a Android e iOS
NotebookLM

Google está ampliando el alcance de NotebookLM, su herramienta de investigación y síntesis de contenidos, con la llegada de la función de “Video Overview” a las aplicaciones móviles de Android e iOS. Hasta ahora disponible en la versión web, esta característica permite generar videos explicativos que resumen documentos, páginas web u otras fuentes cargadas por el usuario, apoyándose en los modelos Gemini.

Con la última actualización, los usuarios pueden abrir la app de NotebookLM en su teléfono, ir a la lista de cuadernos y tocar el botón “Studio” —identificado con un ícono de varita mágica— para acceder al nuevo menú creativo. Desde allí es posible elegir la opción Video Overview y pedirle al sistema que produzca un video que condense el material seleccionado, ya sea para estudiar, preparar presentaciones o repasar información compleja de forma más amena.

Read more
Apple y Google App Stores están infestadas de apps de IA nudificantes
Head, Person, Face

Tendemos a pensar en la Apple App Store y Google Play Store como "jardines amurallados" digitales: espacios seguros y curados donde el contenido peligroso o turbio se filtra mucho antes de llegar a nuestras pantallas. Pero un nuevo análisis sombrío del Proyecto de Transparencia Tecnológica (TTP) sugiere que las paredes tienen grietas serias. El informe revela una realidad preocupante: ambos grandes escaparates están actualmente infestados de decenas de aplicaciones de "nudify" impulsadas por IA. No son herramientas oscuras ocultas en la dark web; Están ahí, a la vista, permitiendo que cualquiera haga una foto inocente de una persona y le quite la ropa digitalmente sin su consentimiento.

A principios de este año, la conversación sobre esta tecnología alcanzó su punto álgido cuando la IA de Elon Musk, Grok, fue sorprendida generando imágenes sexualizadas similares en la plataforma X. Pero mientras Grok se convirtió en el foco de la indignación pública, la investigación del TTP muestra que fue solo la punta del iceberg. Una simple búsqueda de términos como "desnudarse" o "nudify" en las tiendas de aplicaciones arroja una larga lista de programas diseñados específicamente para crear pornografía deepfake no consensuada.

Read more
Google Maps incorpora la IA de Gemini ahora para peatones y ciclistas
Google Maps

La compañía de Mountain View ha extendido las capacidades de su asistente de inteligencia artificial Gemini hacia nuevos contextos de movilidad urbana. Luego de la integración exitosa en navegación vehicular durante los últimos meses, Google Maps ahora permite que caminantes y ciclistas aprovechen la tecnología conversacional mientras se desplazan.

Esta expansión funcional ofrece a los usuarios la posibilidad de realizar consultas conversacionales en tiempo real sobre su entorno inmediato. Mediante comandos de voz o texto, es posible formular preguntas contextuales tales como: "¿Cuáles son los locales más valorados en esta zona?" o "¿En qué barrio me encuentro?". La inteligencia artificial proporciona recomendaciones personalizadas basadas en información de Maps y preferencias previas del usuario.

Read more