Die Entwicklung von künstlicher Intelligenz (KI), die in der Lage ist, komplexe Aufgaben in virtuellen Umgebungen zu bewältigen, schreitet rasant voran. Ein neuer Forschungsansatz, bekannt als PORTAL, demonstriert die Fähigkeit von KI-Agenten, tausende von 3D-Videospielen zu spielen. Dieser Durchbruch eröffnet neue Möglichkeiten für die Entwicklung von Spiel-KI, aber auch für Anwendungen in anderen Bereichen wie Robotik und Automatisierung.
PORTAL basiert auf der innovativen Idee, die Entscheidungsfindung in Videospielen in eine sprachbasierte Aufgabe umzuwandeln. Anstatt auf rechenintensive Methoden des Reinforcement Learning zu setzen, nutzt PORTAL große Sprachmodelle (LLMs), um Verhaltensbäume in einer domänenspezifischen Sprache (DSL) zu generieren. Diese Bäume beschreiben die Aktionen, die der KI-Agent im Spiel ausführt. Durch die Nutzung von LLMs kann PORTAL die Komplexität des Lernprozesses erheblich reduzieren und gleichzeitig eine hohe strategische Tiefe und schnelle Anpassungsfähigkeit gewährleisten.
Die Architektur von PORTAL kombiniert regelbasierte Knoten mit neuronalen Netzwerkkomponenten. Diese hybride Struktur ermöglicht es dem KI-Agenten, sowohl strategische Entscheidungen auf hoher Ebene zu treffen als auch präzise Aktionen auf niedriger Ebene auszuführen. Die regelbasierten Komponenten sorgen für eine klare Struktur und Interpretierbarkeit der Entscheidungen, während die neuronalen Netze die Feinabstimmung der Aktionen in Echtzeit ermöglichen.
Ein weiteres wichtiges Element von PORTAL ist der duale Feedback-Mechanismus. Dieser Mechanismus kombiniert quantitative Spielmetriken, wie z.B. die Punktzahl, mit der Analyse von Vision-Language-Modellen. Dadurch kann die KI-Strategie sowohl auf taktischer als auch auf strategischer Ebene iterativ verbessert werden. Die Analyse von visuellen Informationen aus dem Spiel ermöglicht es dem Agenten, seine Umgebung besser zu verstehen und seine Aktionen entsprechend anzupassen.
PORTAL bietet mehrere Vorteile gegenüber traditionellen Ansätzen zur Entwicklung von Spiel-KI. Die generierten Strategien sind sofort einsetzbar, für Menschen interpretierbar und können auf verschiedene Spielumgebungen generalisiert werden. Der Entwicklungsaufwand ist im Vergleich zu Reinforcement Learning deutlich geringer, da die KI nicht durch langwierige Trainingsprozesse lernen muss. Die Experimente mit PORTAL in tausenden von First-Person-Shooter-Spielen (FPS) zeigen eine signifikante Verbesserung der Entwicklungseffizienz, der Generalisierung der Strategien und der Verhaltensvielfalt.
PORTAL stellt einen bedeutenden Fortschritt in der Entwicklung von Spiel-KI dar. Der Ansatz könnte auch über den Bereich der Videospiele hinaus Anwendung finden, beispielsweise in der Robotik, wo KI-Agenten komplexe Aufgaben in realen Umgebungen bewältigen müssen. Die Fähigkeit, durch Sprache gesteuerte Strategien zu generieren und diese durch Feedback zu optimieren, eröffnet neue Möglichkeiten für die Entwicklung intelligenter Systeme.
Bibliographie: - https://arxiv.org/abs/2503.13356 - https://arxiv.org/html/2503.13356v1 - https://www.linkedin.com/posts/naveen-manwani-65491678_paper-alert-paper-title-agents-play-activity-7306711641453146112-S3eF - https://synthical.com/article/Agents-Play-Thousands-of-3D-Video-Games-f517908c-5a2a-4cd5-b336-61cedc1a1f14? - https://www.science.org/doi/10.1126/science.aau6249 - https://www.wired.com/story/google-deepmind-ai-agent-learned-to-play-goat-simulator-3/ - https://www.reddit.com/r/ElvenAINews/comments/1jerkgw/250313356_agents_play_thousands_of_3d_video_games/ - https://github.com/BAAI-Agents/GPA-LM - https://www.nature.com/articles/s41586-025-08600-3 - https://www.researchgate.net/publication/366907684_Towards_Agent-Based_Testing_of_3D_Games_using_Reinforcement_Learning