Skip to main content
  1. Casa
  2. Noticias
  3. Tendencias
  4. Videojuegos
  5. News

Claude, ChatGPT o Gemini: que IA gana en una partida de Super Mario Bros.

Una imagen del videojuego Super Mario Bros.
DTES

Super Mario Bros. de 1985 podría parecer un reto sencillo para cualquier IA que se precie de tener la mejor capacidad de procesamiento y ejecución, sin embargo, 40 años después un experimento de la Universidad de California demostró que el juego de Super Nintendo fue un desafío monumental para cuatro modelos de IA: Claude 3.5 y 3.7 de Anthropic,  GPT-4o de OpenAI y Gemini 1.5 Pro de Google.

El experimento utilizó una versión emulada del clásico juego de Nintendo, integrada con un marco personalizado llamado GamingAgent, desarrollado por Hao Lab. Este sistema permitió a los modelos de IA controlar a Mario mediante la generación de código Python. Para guiar sus acciones, los modelos recibieron instrucciones básicas, como “Salta sobre ese enemigo”, junto con visualizaciones de capturas de pantalla del estado del juego.

Claude-3.7 was tested on Pokémon Red, but what about more real-time games like Super Mario 🍄🌟?

We threw AI gaming agents into LIVE Super Mario games and found Claude-3.7 outperformed other models with simple heuristics. 🤯

Claude-3.5 is also strong, but less capable of… pic.twitter.com/bqZVblwqX3

— Hao AI Lab (@haoailab) February 28, 2025

Cuando se trató de dominar Super Mario Bros., el mejor desempeño fue Claude 3.7 de Anthropic, que mostró reflejos impresionantes, encadenando saltos precisos y evitando hábilmente a los enemigos. Incluso su predecesor, Claude 3.5, funcionó bien.

Recommended Videos

Sorprendentemente, los modelos con mucho razonamiento como GPT-4o de OpenAI y Gemini 1.5 Pro de Google se quedaron atrás. A pesar de su reputación de fuertes habilidades de razonamiento, lucharon con las demandas del juego, probablemente tardaron demasiado en calcular sus próximos movimientos, lo que llevó a muertes frecuentes y prematuras.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
El OnePlus Ace 6T debuta con Snapdragon 8 Gen 5, y se parece mucho al 15R
Electronics, Phone, Mobile Phone

OnePlus acaba de levantar oficialmente el telón del Ace 6T en China, y básicamente es un buque insignia disfrazado de gama media. Este lanzamiento es un gran adelanto porque se espera ampliamente que el Ace 6T sea el modelo para el OnePlus 15R, que está previsto que aterrice en India el 17 de diciembre.

Si tienes curiosidad por el precio, el teléfono empieza en 2.599 CNY (unos 367 USD) para el modelo base. Si quieres la versión al máximo con 16GB de RAM y 1TB de almacenamiento, te faltan 3.699 CNY (unos 523 USD). Llega hoy 5 de diciembre a las estanterías en tres colores: Negro Flash, Verde Fugaz y Violeta Eléctrico.

Leer más
Samsung tiene un nuevo rival para el Apple Watch Ultra 3
Wristwatch, Arm, Body Part

¿Qué ha pasado? El gigante tecnológico coreano Samsung está trabajando en un sucesor del Galaxy Watch Ultra, que podría llegar tan pronto como en 2026.

Según un informe de GalaxyClub, Samsung está trabajando en un nuevo smartwatch con el nombre en clave "Galaxy Watch 9 Ultra".

Leer más
Tu laptop con Windows en ARM podría reproducir juegos reales de PC
Electronics, Computer Hardware, Hardware

¿Qué ha pasado? Por primera vez, se ha demostrado públicamente una tarjeta gráfica discreta funcionando en Windows en ARM. Como informó primero ITHome, la GPU en cuestión es la Lisuan 7G106, una dGPU fabricada en China que recientemente se mostró ejecutando un benchmark de 3DMark en un sistema Windows basado en ARM. Aunque aún es muy temprano y está lejos de ser un producto listo para el consumidor, la demo en sí es un momento histórico para el ecosistema ARM Windows.

El Lisuan 7G106 se mostró ejecutando 3DMark Time Spy en Windows en ARM, confirmando el soporte real de drivers para dGPU.

Leer más