Skip to main content

Google presenta Gemini: su respuesta más poderosa a GPT-4

Imagen utilizada con permiso del titular de los derechos de autor

El área de investigación Google DeepMind acaba de lanzar el competidor más poderoso hasta la fecha del popular estándar GPT-4, ya que presentó Google Gemini, su modelo de lenguaje grande más grande y más capaz hasta la fecha. A partir de hoy, el chatbot Bard de la compañía funcionará con una versión de Gemini y estará disponible en inglés en más de 170 países y territorios. Los desarrolladores y clientes empresariales tendrán acceso a Gemini a través de API la próxima semana, y una versión más avanzada estará disponible el próximo año.

Recommended Videos

¿Google dice que el rendimiento de su modelo más capaz «supera los resultados actuales de última generación en 30 de los 32 puntos de referencia académicos ampliamente utilizados en investigación y desarrollo de LLM». Gemini también obtuvo una puntuación del 90,0% en una prueba conocida como » Comprensión masiva del lenguaje multitarea » o MMLU, que evalúa las capacidades en 57 materias, incluidas matemáticas, física, historia y medicina. Es el primer LLM que se desempeña mejor que los expertos humanos en la prueba, dijo Google.

También Gemini da muestra de una increíble capacidad en programación e ingeniería de software. El año pasado, utilizando un modelo de lenguaje más antiguo, DeepMind introdujo un sistema de inteligencia artificial llamado AlphaCode que superó al 54 por ciento de los codificadores humanos en competencias de codificación. Utilizando Gemini, Google creó una versión de próxima generación llamada AlphaCode 2. La secuela superó a aproximadamente el 85 por ciento de los humanos, dijo la compañía.

Gemini es nativamente multimodal, lo que significa que puede analizar el contenido de una imagen y responder preguntas sobre ella, o crear una imagen a partir de un mensaje de texto. Durante una sesión informativa el martes, un ejecutivo de Google subió una foto de una tarea de matemáticas en la que el estudiante había mostrado sus cálculos hasta la respuesta final. Géminis pudo identificar en qué paso del proceso del estudiante se había equivocado, le explicó su error y cómo responder correctamente a la pregunta.

Gemini estará disponible en tres “tamaños”:

  • Nano, que es lo suficientemente pequeño como para caber en un teléfono inteligente y potenciará las funciones del teléfono inteligente Pixel 8 Pro a partir de hoy;
  • Pro, que ahora impulsa a Bard;
  • y Ultra, que comenzará a aparecer en los productos el próximo año, que impulsará un nuevo chatbot que la compañía llama Bard Advanced y que podría ser la respuesta a ChatGPT Plus: un producto pago basado en suscripción para usuarios que desean el mejor producto disponible.

A partir de ahí, dice Google, Gemini comenzará a permear todo el ecosistema de productos empresariales y de consumo de la compañía, comenzando con la búsqueda, Chrome, los anuncios y sus aplicaciones de productividad .

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Google lanza Gemini 2.5 Pro, su «modelo de IA más inteligente» hasta la fecha
Gemini 2.5 Pro

En una publicación de blog, Google anunció Gemini 2.5 Pro (experimental) para desarrolladores y suscriptores avanzados, con el objetivo de ayudarlo a abordar problemas cada vez más complejos. Es el primero de la familia y está preparado para "pensar" antes de hablar.
Google dice que estará disponible hoy en Google AI Studio (su plataforma para desarrolladores) y para los suscriptores avanzados, con soporte para Vertex AI próximamente. Google también afirma superar a la competencia, y que Gemini 2.5 Pro ocupa el primer lugar en la tabla de clasificación de LMArena con un 18,8%, superando a otros modelos de IA como ChatGPT y Deepseek.
"Gemini 2.5 Pro es de última generación en una variedad de puntos de referencia que requieren un razonamiento avanzado. Sin técnicas de tiempo de prueba que aumenten el costo, como la votación mayoritaria, 2.5 Pro lidera en puntos de referencia de matemáticas y ciencias como GPQA y AIME 2025. También obtiene una puntuación de última generación del 18,8% en modelos sin uso de herramientas en Humanity's Last Exam, un conjunto de datos diseñado por cientos de expertos en la materia para capturar la frontera humana del conocimiento y el razonamiento".
Si ya está suscrito a Gemini Advanced, puede usar Gemini 2.5 Pro sin costo adicional, pero si necesita usarlo a mayor escala, Google publicará los precios en las próximas semanas para el uso más alto. Con 2.5 Pro, obtienes una ventana de contexto de un millón, pero pronto habrá una ventana de dos millones. Google también dice que Gemini 2.5 Pro puede manejar problemas difíciles de fuentes como audio, texto, imágenes, repositorios de código completos y video.
 

Leer más
OpenAI lanza el modelo de IA GPT-4.5 con conocimientos y emociones más profundos
OpenAI - 4.5

OpenAI acaba de presentar su último modelo de IA, denominado GPT-4.5, que según la compañía es su mayor y mejor modelo hasta la fecha. No se trata de un modelo de razonamiento, una facultad que se limita a los modelos de la serie O. A pesar de ello, se dice que GPT-4.5 es un conversador más natural, con un mayor cociente emocional y una mayor capacidad de resolución de problemas.
En cuanto a las competencias básicas, tiene acceso a la información más reciente de la web, permite la carga de archivos y multimedia, y es compatible con la plataforma Canvas para tareas relacionadas con la codificación. Sin embargo, actualmente carece de soporte para el modo de voz, la comprensión de video y el uso compartido de pantalla.
Por ahora, este modelo se limita a la fase de vista previa de la investigación, lo que significa que ni siquiera está ampliamente disponible para los suscriptores de ChatGPT Plus. Parece que los desafíos de infraestructura están frenando la disponibilidad más amplia de GPT-4.5 en el mercado.

IA abierta

Leer más
Gemini 2.0: Google presenta su IA más avanzada hasta la fecha
gemini 20 nuevo modelo ia google 2 0

Google presentó este miércoles 11 de diciembre Gemini 2.0, el último modelo de IA de la compañía y el más capaz hasta el momento, diseñado en la era de los agentes autónomos de IA. Los nuevos avances multimodales permiten construir agentes que pueden pensar, recordar y tomar acciones guiados por las personas.
Basados en todos los adelantos de Gemini 1.0 -lanzado hace un año-, Gemini 2.0 mejora su rendimiento, e incluye nuevas capacidades, como la generación nativa de imágenes y audio multilingüe y el uso nativo de herramientas inteligentes, que se conectan directamente a productos de Google como el Buscador y hasta puede ejecutar código. Estas funciones hacen posible construir agentes que pueden pensar, recordar, planificar e incluso tomar acciones.
De esta forma, Gemini 2.0 impulsará nuevas experiencias de IA en todos los productos de Google, haciéndolos más útiles e intuitivos para todos y todas.

Gemini 2.0 trae estas nuevas características

Leer más