Los generadores de imágenes de IA están llegando a niveles bastante altos, y para muestra un botón nuevamente: ya que Google está desarrollando un modelo de IA que es capaz de simular el clásico shooter de PC de 1993, Doom, pero sin usar el código informático del propio juego.

En cambio, el modelo de los investigadores funciona subiendo imágenes fijas para el juego como lo hace un generador de imágenes de IA, excepto que puede hacerlo en tiempo real a más de 20 cuadros por segundo para una experiencia jugable.

¿Cómo funciona el simulador de IA?

El jugador realiza una acción o entrada, el estado del juego se actualiza en consecuencia y luego muestra el resultado en la pantalla. Este llamado «bucle de juego» crea la ilusión de que estás en un mundo virtual interactivo, a pesar de que tu computadora solo te muestra imágenes cambiantes en la pantalla.

Los investigadores utilizaron Stable Diffusion versión 1.4, un generador de imágenes de IA de código abierto. También desarrollaron un modelo de IA separado para jugar el juego real de Doom mientras grababan las imágenes por un total de 900 millones de fotogramas. Los datos de entrenamiento resultantes son utilizados por Stable Diffusion para bombear imágenes del juego, adaptándolas a medida que recibe entradas del jugador.

El equipo publicó varios clips de GameNGen renderizando Doom, incluyendo imágenes de jugadores humanos probándolo. Los resultados muestran que el modelo de IA es capaz de simular con precisión el clásico shooter de PC tanto visualmente como a nivel de juego.

¿Las limitaciones del modelo?: «El modelo solo tiene acceso a un poco más de 3 segundos de historia», escribieron los investigadores. Como resultado, los enemigos y los objetos a veces pueden aparecer de la nada y luego desaparecer segundos después.

¿Cómo funciona el simulador de IA?

Recomendaciones del editor