Una IA logra récords históricos en Montezuma de Atari

Los videojuegos pueden ser buenos escenarios para poner a prueba a la inteligencia artificial (IA). Un grupo de investigadores demostró cómo una IA es capaz de recordar sus éxitos anteriores en un juego y utilizarlos para crear estrategias nuevas.

Esto le permitió conseguir puntuaciones récord en algunos de los títulos más difíciles de las consolas clásicas de Atari, como el Montezuma.

De acuerdo con los científicos, muchos sistemas de IA usan el aprendizaje por refuerzo, a través del cual un algoritmo recibe una retroalimentación positiva o negativa sobre su progreso hacia un objetivo luego de cada paso que da, lo que lo motiva hacia una solución determinada.

Junto a su equipo, Adrien Ecoffet, de Uber Al Labs, plantearon la hipótesis de que estos algoritmos suelen tropezar con vías alentadoras, pero después saltan a otra zona en busca de algo más prometedor dejando de lado soluciones mejores.

“¿Qué haces cuando no sabes nada de tu tarea? Si te limitas a agitar los brazos, es poco probable que consigas hacer un café”, señala Ecoffet.

Para solucionar este problema, el equipo creó un algoritmo que recuerda todos los enfoques que ha probado y continúa volviendo a los momentos en los que tuvo una puntuación alta como punto de partida para seguir explorando.

El software almacena capturas de pantalla de un título mientras juega para recordar lo que ha probado; agrupa imágenes parecidas para identificar puntos del juego a los que deberá regresar como punto de partida.

El objetivo del algoritmo es maximizar su puntuación. El equipo dispuso que el algoritmo jugara una colección de 55 títulos de Atari; superó a los algoritmos más avanzados el 85.5 por ciento de las veces.

Peter Bentley, investigador del University College de Londres, cree que el enfoque del equipo, que combina aprendizaje por refuerzo con un archivo de memoria, podría aplicarse para tratar problemas más complejos.

“Se trata de una nueva y agradable combinación de técnicas que parece proporcionar una mejora real”, afirma.

Recomendaciones del editor