Google presentó este miércoles 11 de diciembre Gemini 2.0, el último modelo de IA de la compañía y el más capaz hasta el momento, diseñado en la era de los agentes autónomos de IA. Los nuevos avances multimodales permiten construir agentes que pueden pensar, recordar y tomar acciones guiados por las personas.
Basados en todos los adelantos de Gemini 1.0 -lanzado hace un año-, Gemini 2.0 mejora su rendimiento, e incluye nuevas capacidades, como la generación nativa de imágenes y audio multilingüe y el uso nativo de herramientas inteligentes, que se conectan directamente a productos de Google como el Buscador y hasta puede ejecutar código. Estas funciones hacen posible construir agentes que pueden pensar, recordar, planificar e incluso tomar acciones.
De esta forma, Gemini 2.0 impulsará nuevas experiencias de IA en todos los productos de Google, haciéndolos más útiles e intuitivos para todos y todas.
Gemini 2.0 trae estas nuevas características
-
Gemini 2.0 Flash: esta es la primera versión experimental de los modelos 2.0 que pueden crear o editar imágenes o generar texto en diferentes tonos. Estará disponible para usuarios de Gemini Advanced y desarrolladores en Al Studio y Vertex Al.
-
Proyecto Astra: Google compartió las actualizaciones de su prototipo de investigación de lo que puede ser un asistente universal de IA. Potenciado por Gemini 2.0, Astra combina imágenes, videos y voz en una línea de tiempo de eventos para conversaciones más naturales y una recuperación de información eficiente.
-
Proyecto Mariner: un nuevo prototipo de investigación temprana basado en Gemini 2.0. Mariner reimagina cómo las personas interactúan con la web, combinando las capacidades de comprensión multimodal de Gemini con la interacción web para automatizar tareas y tomar acciones en tu nombre.
-
Proyecto Jules: la compañía está explorando cómo agentes de IA pueden apoyar de forma más directa a los desarrolladores. Jules es un agente de código experimental impulsado por IA al que se le puede delegar tareas, como resolver errores y desafíos de codificación. Por el momento, este prototipo estará disponible para un grupo selecto de personas.
-
Deep Research: se trata de una nueva capacidad para los usuarios de Gemini Advanced que utiliza la IA para explorar temas complejos en nombre de quién lo esté ejecutando, y le proporcione hallazgos en un informe completo.
-
Nuevas funciones de Android potenciadas por IA que mejoran la accesibilidad, la creatividad y la productividad. Estas innovaciones incluyen descripciones de imágenes más detalladas, toma de notas inteligente, transferencia de archivos sin problemas mediante códigos QR y capacidades mejoradas de escaneo de documentos.
Qué dijo Sundar Pichai sobre Gemini 2.0
- «Pondremos 2.0 a disposición de desarrolladores y verificadores de confianza hoy mismo. Además, estamos trabajando para implementarlo rápidamente en nuestros productos, empezando por Gemini y el Buscador. A partir de hoy, nuestro modelo Gemini 2.0 Flash Experimental estará disponible para todos los usuarios de Gemini. También lanzamos una nueva función llamada Deep Research, que aplica razonamiento avanzado y funciones de contexto ampliado para actuar como asistente de investigación y explorar temas complejos y compilar informes por ti. Ya está disponible en Gemini Advanced».
- «Ninguno de nuestros productos fue transformado más por la Inteligencia Artificial que el Buscador. Nuestras Visiones Generales creadas por IA ya llegan a mil millones de usuarios, a quienes les permiten hacer nuevas preguntas. Rápidamente, se transformó en una de las funciones más populares en la historia de la búsqueda. El paso siguiente será llevar las funciones de razonamiento avanzado de Gemini 2.0 a la Visiones Generales creadas por IA para resolver temas más complejos y conjuntos de preguntas, incluidas ecuaciones matemáticas avanzadas, preguntas multimodales y código. Empezamos unas pruebas limitadas esta semana y el lanzamiento más amplio será por etapas el próximo año. Además, seguiremos ofreciendo la Vision General creada por IA a más países e idiomas durante 2025».
- «Si Gemini 1.0 tenía como fin organizar y comprender información, Gemini 2.0 tendrá como objetivo hacerlo mucho más útil. No puedo esperar a ver qué traerá la próxima era».