Skip to main content

Claude, ChatGPT o Gemini: que IA gana en una partida de Super Mario Bros.

Una imagen del videojuego Super Mario Bros.
DTES

Super Mario Bros. de 1985 podría parecer un reto sencillo para cualquier IA que se precie de tener la mejor capacidad de procesamiento y ejecución, sin embargo, 40 años después un experimento de la Universidad de California demostró que el juego de Super Nintendo fue un desafío monumental para cuatro modelos de IA: Claude 3.5 y 3.7 de Anthropic,  GPT-4o de OpenAI y Gemini 1.5 Pro de Google.

El experimento utilizó una versión emulada del clásico juego de Nintendo, integrada con un marco personalizado llamado GamingAgent, desarrollado por Hao Lab. Este sistema permitió a los modelos de IA controlar a Mario mediante la generación de código Python. Para guiar sus acciones, los modelos recibieron instrucciones básicas, como «Salta sobre ese enemigo», junto con visualizaciones de capturas de pantalla del estado del juego.

Claude-3.7 was tested on Pokémon Red, but what about more real-time games like Super Mario 🍄🌟?

We threw AI gaming agents into LIVE Super Mario games and found Claude-3.7 outperformed other models with simple heuristics. 🤯

Claude-3.5 is also strong, but less capable of… pic.twitter.com/bqZVblwqX3

— Hao AI Lab (@haoailab) February 28, 2025

Cuando se trató de dominar Super Mario Bros., el mejor desempeño fue Claude 3.7 de Anthropic, que mostró reflejos impresionantes, encadenando saltos precisos y evitando hábilmente a los enemigos. Incluso su predecesor, Claude 3.5, funcionó bien.

Recommended Videos

Sorprendentemente, los modelos con mucho razonamiento como GPT-4o de OpenAI y Gemini 1.5 Pro de Google se quedaron atrás. A pesar de su reputación de fuertes habilidades de razonamiento, lucharon con las demandas del juego, probablemente tardaron demasiado en calcular sus próximos movimientos, lo que llevó a muertes frecuentes y prematuras.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Las respuestas de búsqueda de ChatGPT son «confiadamente incorrectas»
ChatGPT búsqueda

ChatGPT ya era una amenaza para la Búsqueda de Google, pero se suponía que la Búsqueda de ChatGPT lograría su victoria, además de ser una respuesta a la IA Perplexity. Pero según un estudio recientemente publicado por el Centro Tow de Periodismo Digital de Columbia, ChatGPT Search tiene dificultades para proporcionar respuestas precisas a las consultas de sus usuarios.

Los investigadores seleccionaron 20 publicaciones de cada una de las tres categorías: las que se asociaron con OpenAI para usar su contenido en los resultados de búsqueda de ChatGPT, las involucradas en demandas contra OpenAI y los editores no afiliados que han permitido o bloqueado el rastreador de ChatGPT.

Leer más
Hay una nueva forma de usar ChatGPT en tu iPhone. Así es como funciona
demandan apple millones dolares monopolio icloud iphone 16 plus

Hay una nueva forma de acceder a ChatGPT en el iPhone y el iPad de Apple. Según lo informado por MacRumors, la última versión de la aplicación ChatGPT facilita aún más el acceso a la función SearchGPT de la aplicación.

ChatGPT, un sofisticado chatbot de IA desarrollado por OpenAI, utiliza un conjunto de datos cada vez mayor para responder preguntas, escribir historias, resumir temas fácticos, traducir idiomas y crear contenido creativo. Está disponible en dispositivos Apple a través de la aplicación ChatGPT, y se espera que se integre en Siri en una futura versión de Apple Intelligence.

Leer más
Apple está diseñando al Siri que quiere aplastar a ChatGPT
apple siri quiere aplastar chatgpt omid armin agrtdozlpyw unsplash

Apple sabe que en la carrera por la IA comenzó desde las posiciones de atrás, sobre todo porque OpenAI, Microsoft y Google ya tenían una pole position bien ganada por el desarrollo de algunos años.

Pero ahora, la compañía de Tim Cook se quiere colocar a tono y para eso busca potenciar a Siri como el competidor más directo de ChatGPT.

Leer más