Al igual que la vida real, los videojuegos son entornos de aprendizaje para la inteligencia artificial. Es por ello que Google anunció su nuevo agente de IA, SIMA (abreviatura de Scalable Instructable Multiworld Agent), que puede seguir instrucciones en lenguaje natural para realizar tareas en una variedad de entornos de videojuegos.
SIMA es un agente de IA de Google para entornos virtuales 3D, que puede comprender una amplia gama de mundos de videojuegos, y seguir instrucciones en lenguaje natural para realizar tareas dentro de ellos, como lo haría un humano.
Pero a diferencia de lo que podría pensarse, su prioridad no es ganarle a los humanos con los puntajes más altos. De acuerdo con el informe técnico de Google DeepMind, su objetivo es seguir instrucciones en una variedad de configuraciones de juego.
La investigación muestra cómo podemos traducir las capacidades de los modelos avanzados de inteligencia artificial en acciones útiles en el mundo real a través de una interfaz de lenguaje. «Esperamos que SIMA y otras investigaciones sobre agentes de IA puedan utilizar los videojuegos como entornos de prueba para comprender mejor cómo los sistemas de inteligencia artificial pueden volverse más útiles», se indica en un comunicado.
¿Cómo se entrenó el agente de IA para videojuegos?
El agente de IA, SIMA, fue entrenado con nueve videojuegos diferentes, desarrollados por ocho estudios, como No Man’s Sky de Hello Games y Teardown de Tuxedo Labs.
«También utilizamos cuatro entornos de investigación, incluido un nuevo entorno que construimos con Unity llamado Construction Lab, donde los agentes necesitan construir esculturas a partir de bloques de construcción que ponen a prueba su manipulación de objetos y su comprensión intuitiva del mundo físico», se explica.
Al aprender de diferentes mundos de juego, SIMA captura cómo el lenguaje se relaciona con el comportamiento del juego. Para el estudio también se realizaron pruebas con jugadores humanos que jugaron libremente, así como siguieron roles de instructor y jugador.
El agente de IA de Google no necesita acceder al código fuente de un juego ni a un API personalizada. Requiere sólo dos entradas: las imágenes en pantalla e instrucciones sencillas en lenguaje natural proporcionadas por el usuario. SIMA utiliza salidas de teclado y mouse para controlar el personaje central de los juegos para llevar a cabo estas instrucciones.
La versión actual de SIMA fue evaluada en 600 habilidades básicas, que abarcan navegación (por ejemplo, «girar a la izquierda»), interacción con objetos («subir la escalera») y uso del menú («abrir el mapa»). Las tareas simples se pueden completar en aproximadamente 10 segundos.
Se espera que, en nuevas investigaciones, se exploren nuevos objetivos como «Buscar recursos y construir un campamento», una tarea de los juegos de estrategia.
El estudio también revela que el agente de IA que jugó los nueve títulos superó significativamente a todos los agentes especializados capacitados únicamente en cada uno de ellos.