El área de investigación Google DeepMind acaba de lanzar el competidor más poderoso hasta la fecha del popular estándar GPT-4, ya que presentó Google Gemini, su modelo de lenguaje grande más grande y más capaz hasta la fecha. A partir de hoy, el chatbot Bard de la compañía funcionará con una versión de Gemini y estará disponible en inglés en más de 170 países y territorios. Los desarrolladores y clientes empresariales tendrán acceso a Gemini a través de API la próxima semana, y una versión más avanzada estará disponible el próximo año.
¿Google dice que el rendimiento de su modelo más capaz «supera los resultados actuales de última generación en 30 de los 32 puntos de referencia académicos ampliamente utilizados en investigación y desarrollo de LLM». Gemini también obtuvo una puntuación del 90,0% en una prueba conocida como » Comprensión masiva del lenguaje multitarea » o MMLU, que evalúa las capacidades en 57 materias, incluidas matemáticas, física, historia y medicina. Es el primer LLM que se desempeña mejor que los expertos humanos en la prueba, dijo Google.
También Gemini da muestra de una increíble capacidad en programación e ingeniería de software. El año pasado, utilizando un modelo de lenguaje más antiguo, DeepMind introdujo un sistema de inteligencia artificial llamado AlphaCode que superó al 54 por ciento de los codificadores humanos en competencias de codificación. Utilizando Gemini, Google creó una versión de próxima generación llamada AlphaCode 2. La secuela superó a aproximadamente el 85 por ciento de los humanos, dijo la compañía.
Gemini es nativamente multimodal, lo que significa que puede analizar el contenido de una imagen y responder preguntas sobre ella, o crear una imagen a partir de un mensaje de texto. Durante una sesión informativa el martes, un ejecutivo de Google subió una foto de una tarea de matemáticas en la que el estudiante había mostrado sus cálculos hasta la respuesta final. Géminis pudo identificar en qué paso del proceso del estudiante se había equivocado, le explicó su error y cómo responder correctamente a la pregunta.
Gemini estará disponible en tres “tamaños”:
- Nano, que es lo suficientemente pequeño como para caber en un teléfono inteligente y potenciará las funciones del teléfono inteligente Pixel 8 Pro a partir de hoy;
- Pro, que ahora impulsa a Bard;
- y Ultra, que comenzará a aparecer en los productos el próximo año, que impulsará un nuevo chatbot que la compañía llama Bard Advanced y que podría ser la respuesta a ChatGPT Plus: un producto pago basado en suscripción para usuarios que desean el mejor producto disponible.
A partir de ahí, dice Google, Gemini comenzará a permear todo el ecosistema de productos empresariales y de consumo de la compañía, comenzando con la búsqueda, Chrome, los anuncios y sus aplicaciones de productividad .