Autonome KI-Agenten erkunden die Minecraft-Welt

Veröffentlicht am 8. August 2024 um 15:59

Open-World-Videospiele, die nach klaren Regeln funktionieren, erscheinen als die perfekte Forschungsumgebung für autonome KI-Agenten. Das trifft in besonderer Weise auf das Video-Spiel Minecraft zu. In den letzten Jahren haben Forscher u.a. mit der Bibliothek MineRL und dem Projekt MineDojo die Voraussetzungen für das neue KI-Framework namens Odyssey geschaffen. Mit dem Framework wollen die Forscher den Grundstein für autonome Agenten legen, die in der Lage sind, eigenständig die Welt von Minecraft zu erkunden. 

Das Framework soll in erster Linie dazu dienen, die Leistung eines Agenten bei unterschiedlichen und dynamischen Aufgaben umfassend zu bewerten. Die derzeitigen Methoden zur Bewertung autonomer Agenten sind begrenzt, vor allem im Kontext der offenen Welt. So verfügen Agenten mit Verstärkungslernen nur über begrenztes Wissen und haben Schwierigkeiten mit der langfristigen Planung. Odyssey verwendet große Sprachmodelle (LLMs), um Pläne zu erstellen und Agenten durch komplexe Aufgaben zu führen. Zu den Unternehmen, die zur Entwicklung des Frameworks beigetragen haben, zählen Microsoft Research und Google DeepMind. 

Durch die Erstellung sprachbasierter Pläne können Agenten übergeordnete Ziele in spezifische Teilziele zerlegen, wodurch komplexe Aufgaben leichter zu bewältigen sind. Diese Methode nutzt semantisches Retrieval, um die relevantesten Fähigkeiten aus einer vordefinierten Bibliothek abzugleichen, so dass sich Agenten effizient an neue Situationen anpassen und Aufgaben effektiv ausführen können.

Die Architektur des Odyssey Frameworks besteht aus einem Planer, einem Akteur und einem Kritiker, die jeweils eine entscheidende Rolle bei der Ausführung der Aufgaben des Agenten spielen. Der Planer entwickelt einen umfassenden Plan, der die übergeordneten Ziele in spezifische, umsetzbare Teilziele aufschlüsselt. Der Akteur führt diese Teilziele aus, indem er die relevantesten Fähigkeiten aus der Fähigkeitenbibliothek abruft und anwendet. Der Kritiker bewertet die Ausführung und liefert Feedback und Erkenntnisse zur Verfeinerung künftiger Strategien. Mit diesem umfassenden Ansatz soll sichergestellt werden, dass die Agenten sich kontinuierlich anpassen und verbessern können.

Die Ergebnisse der ersten Tests sind vielversprechend. So erledigten Agenten, die den Rahmen nutzen, 85 % der langfristigen Planungsaufgaben, verglichen mit 60 % bei den Basismodellen. Bei den dynamisch-unmittelbaren Planungsaufgaben lag die Erfolgsquote bei 90 % und damit deutlich über den 65 %, die mit früheren Methoden erreicht wurden. Bei den Aufgaben zur autonomen Erkundung konnte die Effizienz um 40 % gesteigert werden, wobei die Agenten erfolgreich durch komplexe Umgebungen navigierten und die Aufgaben in 30 % weniger Zeit erledigten. Die Gesamtfehlerquote wurde um 25 % gesenkt, und die Agenten konnten ihre Aufgaben um 20 % schneller abschließen. 

Quellen und weitere Informationen:

Odyssey: Empowering Agents with Open-World Skills

ODYSSEY: A New Open-Source AI Framework that Empowers Large Language Model (LLM)-based Agents with Open-World Skills to Explore the Vast Minecraft World

Mehr als nur Blöcke stapeln: Forscher nutzen Minecraft, um KI-Agenten echte Autonomie beizubringen

 

Kommentar hinzufügen

Kommentare

Es gibt noch keine Kommentare.