Skip to main content

Claude, ChatGPT o Gemini: que IA gana en una partida de Super Mario Bros.

Una imagen del videojuego Super Mario Bros.
DTES

Super Mario Bros. de 1985 podría parecer un reto sencillo para cualquier IA que se precie de tener la mejor capacidad de procesamiento y ejecución, sin embargo, 40 años después un experimento de la Universidad de California demostró que el juego de Super Nintendo fue un desafío monumental para cuatro modelos de IA: Claude 3.5 y 3.7 de Anthropic,  GPT-4o de OpenAI y Gemini 1.5 Pro de Google.

El experimento utilizó una versión emulada del clásico juego de Nintendo, integrada con un marco personalizado llamado GamingAgent, desarrollado por Hao Lab. Este sistema permitió a los modelos de IA controlar a Mario mediante la generación de código Python. Para guiar sus acciones, los modelos recibieron instrucciones básicas, como «Salta sobre ese enemigo», junto con visualizaciones de capturas de pantalla del estado del juego.

Claude-3.7 was tested on Pokémon Red, but what about more real-time games like Super Mario 🍄🌟?

We threw AI gaming agents into LIVE Super Mario games and found Claude-3.7 outperformed other models with simple heuristics. 🤯

Claude-3.5 is also strong, but less capable of… pic.twitter.com/bqZVblwqX3

— Hao AI Lab (@haoailab) February 28, 2025

Cuando se trató de dominar Super Mario Bros., el mejor desempeño fue Claude 3.7 de Anthropic, que mostró reflejos impresionantes, encadenando saltos precisos y evitando hábilmente a los enemigos. Incluso su predecesor, Claude 3.5, funcionó bien.

Recommended Videos

Sorprendentemente, los modelos con mucho razonamiento como GPT-4o de OpenAI y Gemini 1.5 Pro de Google se quedaron atrás. A pesar de su reputación de fuertes habilidades de razonamiento, lucharon con las demandas del juego, probablemente tardaron demasiado en calcular sus próximos movimientos, lo que llevó a muertes frecuentes y prematuras.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Ahora puedes ver todas tus imágenes generadas por ChatGPT en un solo lugar
ChatGPT imágenes IA

OpenAI generó texto e imágenes por separado durante bastante tiempo, pero todo eso cambió hace un par de semanas cuando agregó capacidades de imagen directamente a ChatGPT. Ahora, una pequeña pero potente actualización de calidad de vida da a los usuarios acceso a una biblioteca de imágenes donde pueden ver todas las cosas locas que han creado.

https://twitter.com/OpenAI/status/1912255254512722102?ref_src=twsrc%5Etfw%7Ctwcamp%5Etweetembed%7Ctwterm%5E1912255254512722102%7Ctwgr%5E27dbb423716762aa13c5410f87be13a3cf77c553%7Ctwcon%5Es1_&ref_url=https%3A%2F%2Fwww.digitaltrends.com%2Fcomputing%2Fchatgpt-adds-image-library%2F

Leer más
Encuentran un juego nunca estrenado de Mario Bros. en una consola demasiado rara
VB Mario Land

Una verdadera joya apareció hace unos días en internet, ya que un extraño juego nunca estrenado de Mario Bros. para la más rarísima consola Virtual Boy, llamado VB Mario Land, apareció en línea.

Las imágenes fueron descubiertas escondidas en The Internet Archive por el usuario rabidrodent de Bluesky, específicamente en una carpeta de capturas de pantalla de videojuegos extraídas de antiguas bibliotecas de archivos de AOL. Parecen ser activos oficiales distribuidos por Nintendo a la prensa para su uso en informes sobre el juego.

Leer más
OpenAI está jubilando un modelo muy popular en ChatGPT
OpenAI

El tiempo también pasa para la IA, aunque pareciera que es algo tan nuevo y que se implementó hace pocos días, lo cierto es que OpenAI está muy cerca de jubilar a uno de sus modelos más populares: el GPT-4.

Todo fue mostrado en un registro de cambios que informó ChatGPT y que terminaría con el modelo que se implementó hace dos años atrás.

Leer más