Skip to main content

Un modelo de IA simula el clásico Doom solo con sus fotogramas

La imagen muestra una escena del popular juego Doom de 1993.
Imagen utilizada con permiso del titular de los derechos de autor

Los generadores de imágenes de IA están llegando a niveles bastante altos, y para muestra un botón nuevamente: ya que Google está desarrollando un modelo de IA que es capaz de simular el clásico shooter de PC de 1993, Doom, pero sin usar el código informático del propio juego.

En cambio, el modelo de los investigadores funciona subiendo imágenes fijas para el juego como lo hace un generador de imágenes de IA, excepto que puede hacerlo en tiempo real a más de 20 cuadros por segundo para una experiencia jugable.

El modelo se llama GameNGen, y es el tema de un nuevo artículo de investigadores de Google y la Universidad de Tel Aviv. «¿Puede un modelo neuronal que se ejecuta en tiempo real simular un juego complejo con alta calidad? En este trabajo demostramos que la respuesta es sí», escriben. «Específicamente, demostramos que un videojuego complejo, el icónico juego Doom, se puede ejecutar en una red neuronal».

GameNGen

¿Cómo funciona el simulador de IA?

El jugador realiza una acción o entrada, el estado del juego se actualiza en consecuencia y luego muestra el resultado en la pantalla. Este llamado «bucle de juego» crea la ilusión de que estás en un mundo virtual interactivo, a pesar de que tu computadora solo te muestra imágenes cambiantes en la pantalla.

Los investigadores utilizaron Stable Diffusion versión 1.4, un generador de imágenes de IA de código abierto. También desarrollaron un modelo de IA separado para jugar el juego real de Doom mientras grababan las imágenes por un total de 900 millones de fotogramas. Los datos de entrenamiento resultantes son utilizados por Stable Diffusion para bombear imágenes del juego, adaptándolas a medida que recibe entradas del jugador.

El equipo publicó varios clips de GameNGen renderizando Doom, incluyendo imágenes de jugadores humanos probándolo. Los resultados muestran que el modelo de IA es capaz de simular con precisión el clásico shooter de PC tanto visualmente como a nivel de juego.

¿Las limitaciones del modelo?: «El modelo solo tiene acceso a un poco más de 3 segundos de historia», escribieron los investigadores. Como resultado, los enemigos y los objetos a veces pueden aparecer de la nada y luego desaparecer segundos después.

Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
El nuevo refrigerador con IA que prepara tus comidas de Samsung
samsung refrigerador bespoke 2024

La casa inteligente será un concepto importante para Samsung en este próximo CES 2024, y uno de los lanzamientos esperados será el del refrigerador con IA, Bespoke 2024, incluida una cámara interna que puede identificar alimentos individuales y una aplicación conectada que puede sugerir recetas basadas en lo que tiene en stock.

Los usuarios pueden reflejar la pantalla de sus teléfonos Galaxy en la pantalla táctil Family Hub de 32 pulgadas, e incluso hay aplicaciones separadas para videos de TikTok y YouTube.

Leer más
¿Grimes le pelea a Elon Musk la marca Grok con un peluche de IA?
grimes baby grok peluche ia

La cantante Grimes parece que quiere hacerle una joda a su ex pareja, el influyente magnate de tecnología Elon Musk, ya que está trabajando en un peluche de IA llamado Baby Grok, que ocupa el nombre de Grok (el chatbot de X), con la startup de Silicon Valley, Curio.

"¡Saludos! Soy Grok, el enérgico cohete de Gabbo", dice la lista de Curio para una edición beta limitada de $ 99 del juguete. "Con una energía ilimitada, siempre me alejo para explorar la inmensidad del cosmos. ¿Listo para volar entre las estrellas conmigo?"

Leer más
El burdo engaño de Google con su demostración de Gemini
google engano demostracion gemini

Google Gemini partió con el pie izquierdo, porque en las últimas horas se descubrió que una de las demostraciones en video de la nueva IA capaz de superar según a los de Mountain View a GPT-4, realizó un montaje.

En un artículo de opinión, Bloomberg dice que Google admite que para su video titulado "Hands-on with Gemini: Interacting with multimodal AI", no solo se editó para acelerar las salidas (lo que se declaró en la descripción del video), sino que la interacción de voz implícita entre el usuario humano y la IA era en realidad inexistente.

Leer más