Google DeepMind ha presentado SIMA (Scalable Instructable Multiworld Agent), un agente de IA generalista diseñado para seguir instrucciones en lenguaje natural y realizar tareas en una variedad de entornos de videojuegos 3D. Este avance marca un hito significativo en la investigación de IA, ya que SIMA puede entender y actuar en múltiples mundos de juegos, similar a cómo lo haría un humano.
(Imagen generada por IA - Copilot)
Importancia de los Videojuegos en la IA
Los videojuegos son entornos de aprendizaje ricos y dinámicos, ideales para probar sistemas de IA. DeepMind lleva utilizando los videojuegos como campo de pruebas de sus investigaciones de IA desde hace mucho tiempo, tanto con juegos Atari como con StarCraft II.
Objetivo de SIMA
Para DeepMind, el objetivo de SIMA no es conseguir grandes puntuaciones, sino aprender a seguir instrucciones en diferentes entornos/ juegos, de esta manera podria desbloquear agentes de IA más utiles para cualquier otro entorno.
Colaboración y Entrenamiento
Para conseguir evolucionar SIMA, DeepMind colaboró con ocho estudios de videojuegos, entrenando y probando SIMA en nueve juegos diferentes. Cada juego ofrece un nuevo mundo interactivo con una variedad de habilidades para aprender, desde la navegación simple y el uso de menús, hasta la minería de recursos, el pilotaje de naves espaciales y la creación de objetos.
Método de Entrenamiento
Para entrenar a SIMA, se grabaron a jugadores humanos jugando, acompañados de otro jugador que observaba y daba indicaciones. Tambien pudieron ver luego estas grabaciones para añadir comentarios sobre otras acciones que llevarian a cabo.
Componentes de SIMA
SIMA está compuesto por modelos de visión preentrenados y un modelo principal que incluye una memoria y genera acciones de teclado y ratón. Este agente puede percibir y entender una variedad de entornos, y luego tomar acciones para lograr un objetivo instruido.
Impacto y Futuro
El trabajo con SIMA demuestra cómo los videojuegos pueden servir para entender mejor cómo los sistemas de IA pueden volverse más útiles. La capacidad de seguir instrucciones en múltiples entornos de juego podría traducirse en aplicaciones prácticas en el mundo real, mejorando la interacción humano-IA.
A nível de desarrollo de videojuegos, este tipo de IA podria ayudar en ciertas fases de testeo del juego, sobretodo en juegos de mundo abierto, en el que probar y testear todas las posibilidades puede ser muy complicado.
Si queréis más información de SIMA : https://deepmind.google/discover/blog/sima-generalist-ai-agent-for-3d-virtual-environments/