Skip to main content

Google contraataca ante Sora de OpenAI con Veo 2

google veo 2 rival sora openai
Imagen utilizada con permiso del titular de los derechos de autor

La división DeepMind de Google presentó el lunes su modelo de generación de video Veo de segunda generación, que puede crear clips de hasta dos minutos de duración y con resoluciones que alcanzan la calidad 4K, es decir, seis veces la duración y cuatro veces la resolución de los clips de 20 segundos / 1080p que Sora puede generar.

Por supuesto, esos son los límites superiores teóricos de Veo 2. Actualmente, el modelo solo está disponible en VideoFX, la plataforma experimental de generación de video de Google, y sus clips tienen un límite de ocho segundos y una resolución de 720p. VideoFX también está en lista de espera, por lo que no cualquiera puede iniciar sesión para probar Veo 2, aunque la compañía anunció que ampliará el acceso en las próximas semanas. Un portavoz de Google también señaló que Veo 2 estará disponible en la plataforma Vertex AI una vez que la compañía pueda escalar suficientemente las capacidades del modelo.

Recommended Videos

«En los próximos meses, continuaremos iterando en función de los comentarios de los usuarios», dijo Eli Collins a TechCrunch, «y buscaremos integrar las capacidades actualizadas de Veo 2 en casos de uso convincentes en todo el ecosistema de Google… Esperamos compartir más actualizaciones el próximo año».

BREAKING: Google just dropped Veo 2 and Imagen 3 — their next gen video and image generation models.

Turns out Google's been closing the gap quietly — not just on LLMs, but on visual creation too.

Here’s everything you need to know w/o the hype 🧵 pic.twitter.com/4BL82HAmEQ

— Bilawal Sidhu (@bilawalsidhu) December 16, 2024

Según se informa, Veo 2 tiene una serie de ventajas sobre sus predecesores, incluida una mejor comprensión de la física (piense en una mejor dinámica de fluidos y mejores efectos de iluminación / sombra), así como la capacidad de generar videoclips «más claros», en el sentido de que las texturas e imágenes generadas son más nítidas y menos propensas a desenfocarse al moverse. El nuevo modelo también ofrece controles de cámara mejorados, lo que permite al usuario posicionar la lente de la cámara virtual con mayor precisión que antes.

Como señala TechCrunch, Veo 2 aún no ha perfeccionado el proceso de generación de video, aunque parece alucinar mucho menos que rivales como Sora, Kling, Movie Gen o Gen 3 Alpha. «La coherencia y la consistencia son áreas de crecimiento», dijo Collins. «Veo puede adherirse consistentemente a una indicación durante un par de minutos, pero no puede adherirse a indicaciones complejas en horizontes largos. Del mismo modo, la consistencia de los personajes puede ser un desafío. También hay espacio para mejorar en la generación de detalles intrincados, movimientos rápidos y complejos, y continuar ampliando los límites del realismo».

Google también anunció mejoras en Imagen 3 el lunes, lo que permite que el modelo de generación de imágenes comerciales cree resultados «más brillantes y mejor compuestos». El modelo, disponible en ImageFX, también ofrecerá sugerencias descriptivas adicionales basadas en palabras clave en el mensaje del usuario, y cada palabra clave generará un menú desplegable de términos relacionados.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Cada vez estamos más cerca del iPhone con IA de Jony Ive para OpenAI
Celular hecho con IA

OpenAI puede estar buscando pivotar en el espacio del hardware y puede estar buscando colaborar con los mejores en el negocio para hacer ese cambio.
Si bien no hay intenciones sólidas, el CEO de OpenAI, Sam Altman, habló recientemente con Nikkei Asia, afirmando que le gustaría que su compañía trabajara junto con el ex jefe de diseño de Apple, Jony Ive, conocido por hacer algunos de los estilos de hardware favoritos de la industria.
"Esperamos hacerlo en asociación con Jony Ive", dijo Altman.
Altman agregó que juntos, OpenAI y Jony Ive podrían crear hardware de IA de próxima generación que podría marcar el comienzo de la mayor disrupción tecnológica desde la introducción del iPhone original en 2007.
Si bien el CEO no tenía más detalles para compartir sobre los planes de la compañía para desarrollar hardware, los informes indican que la marca "OpenAI" apareció en la Oficina de Patentes y Marcas de EE. UU. (USPTO), en una lista que asocia la marca con auriculares, gafas, anteojos, controles remotos, fundas para computadoras portátiles y teléfonos, relojes inteligentes, bisagras inteligentes y auriculares de realidad virtual y aumentada "para la interacción asistida por IA. simulación y entrenamiento", según Techcrunch.
The Information informó que la compañía también está construyendo un equipo de robótica, supuestamente con el objetivo de probar robots humanoides. Su jefa de equipo, Caitlin Kalinowski, dejó la división de gafas de realidad aumentada de Meta para unirse a OpenAI el pasado mes de noviembre.
BGR también señaló que la reciente inversión de SoftBank en OpenAI se puede comparar con la forma en que el jefe de SoftBank, Masayoshi Son, pidió la exclusividad del iPhone en Japón cuando se lanzó por primera vez.
Las especulaciones sobre la posibilidad de que OpenAI desarrolle un smartphone centrado en la IA junto a Jony Ive han persistido desde 2023, con detalles que indican que el dispositivo podría ser como un iPhone con una IA activada por voz, proporcionando una "experiencia más natural e intuitiva", según Windows Central.
Ive confirmó al New York Times el año pasado que estaba trabajando con OpenAI en un proyecto que podría competir con Apple y Samsung en la industria móvil. El diseñador tecnológico declaró que el proyecto ya estaba atrayendo a inversores dispuestos a ofrecer más de 1.000 millones de dólares. Describió el dispositivo como algo que "usaría la IA para crear una experiencia informática que sea menos disruptiva socialmente que el iPhone".
BGR también señaló rumores anteriores que indicaban que Altman e Ive se reunieron con el jefe de SoftBank el año pasado. Dado que OpenAI y SoftBank han firmado un acuerdo de inversión, más piezas podrían estar uniéndose.

Leer más
OpenAI acusa con pruebas que DeepSeek plagió sus modelos de entrenamiento
Una adolescente mira su teléfono con cara de sorpresa

Una grave acusación está realizando OpenAI a su más novel competidor chino, DeepSeek, ya que en una investigación conjunta con Microsoft está indicando con "pruebas concretas" de que la IA asiática entrenó su modelo con datos robados de la compañía de Sam Altman.
Fuentes de Bloomberg, dijeron que los investigadores de seguridad de Microsoft detectaron que a finales de 2024 se estaban filtrando grandes cantidades de datos a través de las cuentas de los desarrolladores de OpenAI, que la empresa cree que están afiliadas a DeepSeek.
OpenAI le dijo al Financial Times que encontró evidencia que vincula a DeepSeek con el uso de la destilación, una técnica común que los desarrolladores usan para entrenar modelos de IA extrayendo datos de otros más grandes y capaces. Es una forma eficiente de entrenar modelos más pequeños a una fracción de los más de 100 millones de dólares que OpenAI gastó para entrenar GPT-4. Si bien los desarrolladores pueden usar la API de OpenAI para integrar su IA con sus propias aplicaciones, destilar los resultados para construir modelos rivales es una violación de los términos de servicio de OpenAI. 
El jefe de la inteligencia artificial del presidente Donald Trump, David Sacks, dijo que "es posible" que se haya producido un robo de propiedad intelectual. "Hay evidencia sustancial de que lo que DeepSeek hizo aquí es destilar conocimiento de los modelos de OpenAI y no creo que OpenAI esté muy contento con esto", dijo Sacks a Fox News el martes.
Lo que dijo OpenAI
Esto es un extracto de lo que OpenAI envío como comunicado al medio Bloomberg en respuesta a esta acusación.

"Sabemos que las empresas con sede en la República Popular China (China), y otras, están constantemente tratando de destilar los modelos de las principales empresas de IA de EE. UU.", dijo OpenAI en un comunicado a Bloomberg. "Como líder en la construcción de IA, nos involucramos en contramedidas para proteger nuestra propiedad intelectual, incluido un proceso cuidadoso para determinar qué capacidades de frontera incluir en los modelos lanzados, y creemos que, a medida que avanzamos, es de vital importancia que trabajemos en estrecha colaboración con el gobierno de los EE. UU. para proteger mejor los modelos más capaces de los esfuerzos de los adversarios y competidores para tomar la tecnología estadounidense".

Leer más
Misterioso acuerdo entre OpenAI y propietario de enorme editorial
Penguin Random House

Un acuerdo bastante curioso es el que se fraguó esta semana entre Bertelsmann (propietario de la editorial Penguin Random House) y la firma de IA de Sam Altman, OpenAI.
Esta alianza, que incluye la implementación de herramientas como ChatGPT Enterprise para todos los empleados del grupo, busca potenciar la creación de contenido, mejorar la eficiencia operativa y explorar nuevas formas de distribución digital.
De entrada, Bertelsmann ha dejado claro que el objetivo es usar la IA generativa para apoyar y potenciar los procesos creativos en todas sus divisiones. En el ámbito editorial, esto se traduce en iniciativas como recomendaciones de libros personalizadas en redes sociales, una herramienta que PRHGE ya venía explorando.
Lo más curioso de todo, es que la misma editorial Penguin Random House había señalado en octubre de 2024  que prohibiría el uso de sus libros para entrenar modelos de lenguaje de gran tamaño (LLM). La multinacional implementó una advertencia en los derechos de autor de todos sus libros, indicando que «ninguna parte de este libro puede utilizarse o reproducirse de ninguna manera con el propósito de entrenar tecnologías o sistemas de inteligencia artificial». Además, alineándose con la regulación de la Unión Europea, también expresó su rechazo al scraping de sus obras y reafirmó su compromiso de proteger los derechos de sus autores.
Rolf Hellermann, CFO de Bertelsmann, asegura que el compromiso con el "uso responsable" de la IA es prioritario, pero estas palabras necesitarán traducirse en acciones concretas para ganar la confianza de la comunidad creativa.
Un ejemplo reciente es el de la editorial HarperCollins que permitió que se usaran ciertos títulos de no ficción para entrenar modelos de IA, pero solo con el consentimiento expreso de los autores y ofreciendo compensaciones económicas. Aunque este modelo de "consentimiento informado" podría ser un camino intermedio, también deja preguntas sobre qué tan inclusivo o rentable puede ser para los autores de menor perfil o para títulos de catálogo menos visibles.

Leer más