Getting your Trinity Audio player ready...
|
Wir stellen uns eine Welt vor, in der MenÂschen und KI-AgenÂten zusamÂmeÂnarÂbeitÂen und nutzbrinÂgend interÂagieren, wobei KI datengestĂĽtzte strateÂgisÂche EmpfehlunÂgen generÂiert, die direkt von anderen KI-AgenÂten umgeÂsetÂzt, an menÂschliche EntscheiÂdungsträger weitÂergegeben oder in komÂplexere interÂakÂtive SysÂteme inteÂgriÂert werÂden könÂnen. Large LanÂguage ModÂels (LLMs) und allÂgeÂmeinÂer FounÂdaÂtion ModÂels (FMs) brinÂgen uns dieser Vision näher, indem sie es Laien ermöglichen, mit KI unter VerÂwenÂdung natĂĽrÂlichÂer Sprache zu interÂagieren und dadurch bei vieÂlen AufÂgaben erheÂbliche, manchÂmal radikale, EffizienÂzgewinne zu erzieÂlen.
Bei der BewÂerÂtung des strateÂgisÂchen Denkens bleiben die FähigkeitÂen dieser ModÂelle jedoch unzureÂichend. Wir schlaÂgen daher eine kolÂlabÂoÂraÂtive ForschungsagenÂda vor, die die EinÂbeziehung spieltheÂoÂretisÂchÂer ParÂaÂdigÂmen in die Forschung und das Design von FMs und LLMs beinÂhalÂtet, und umgekehrt.
Diese ZusamÂmeÂnarÂbeit wird strateÂgisÂche FMs ermöglichen — z.B. LLMs, die in natĂĽrÂlichÂer Sprache komÂmuÂnizieren, aber strateÂgisÂche EntscheiÂdungsÂfähigkeitÂen aufweisen -, die die SchafÂfung eines fruchtÂbaren Ă–kosysÂtems herÂvorÂbrinÂgen könÂnen, in dem MenÂschen und KI-AgenÂten effekÂtiv zusamÂmeÂnarÂbeitÂen.
Quelle: StrateÂgic FounÂdaÂtion ModÂels
StrateÂgisÂche AgenÂten entwickÂeln
Viele erfolÂgreÂiche strateÂgisÂche KI-AgenÂten wurÂden fĂĽr spezÂiÂfisÂche Spiele wie Schach, Go, ShoÂgi und PokÂer entwickÂelt. AlpÂhaZeÂro war ein frĂĽher VerÂsuch, einen allÂgeÂmeinen Spiel-AgenÂten zu entwerÂfen, der ĂĽberÂmenÂschlichÂes SpielÂniveau in mehreren SpieÂlen erreÂichen kann, benötigt jedoch handgeÂferÂtigte Regeln fĂĽr jedes Spiel. MuZeÂro verbesserte AlpÂhaZeÂro, indem es Spielmechaniken und StrateÂgien aus wiederÂholtem SpieÂlen erlernte, wodurch die Notwendigkeit fĂĽr handgeÂferÂtigte Regeln entÂfiel. Trotz ihrer FähigkeitÂen sind diese AlgoÂrithÂmen keine grundleÂgenÂden ModÂelle, da ihr VorÂab-TrainÂing nicht allÂgeÂmein ist.
Empirische spieltheÂoÂretisÂche AnalyÂsen (EGTA) bieten TechÂniken zur Lösung groĂźer Spiele, die nur ĂĽber SimÂuÂlaÂtoren spezÂiÂfiziert sind. Neuere ForschunÂgen konzenÂtriÂeren sich darauf, AgenÂten zu entwickÂeln, die ihre StrateÂgien an verÂschiedene Spiele und GegÂnÂer anpassen könÂnen. Einige AgenÂten zeigen LernÂfähigkeitÂen im KonÂtext, was bedeutet, dass sie ihr VerÂhalÂten basierend auf frĂĽheren SpielverÂläufen anpassen. Diese geschichtsÂbasierten PoliÂtiken sind wichtig fĂĽr optiÂmale EntscheiÂdunÂgen in teilÂweise beobachtÂbaren UmgeÂbunÂgen.
IdeÂalÂerÂweise wĂĽrÂden strateÂgisÂche GrundÂmodÂelle in InterÂakÂtioÂnen EntscheiÂdunÂgen treÂfÂfen, die durch spieltheÂoÂretisÂche VorherÂsagen besÂtimmt sind. Viele interÂesÂsante GleÂichgewichte sind jedoch schwÂer zu berechÂnen. NeurÂal EquiÂlibÂriÂum Solvers (NESs) sind ModÂelle, die SpielinÂstanzen einem GleÂichgewicht zuordÂnen, könÂnen aber nicht immer genaue GleÂichgewichte effizient findÂen.
In einÂer Welt mit mehreren strateÂgisÂchen GrundÂmodÂellen ist es wichtig zu besÂtimÂmen, welchÂes GleÂichgewicht fĂĽr die VorherÂsage ihrer kollekÂtivÂen ErgebÂnisse geeignet ist. StrateÂgisÂche GrundÂmodÂelle könÂnten auch als direkÂte Solver oder zur IniÂtialÂisierung fĂĽr rechenÂinÂtenÂsive ProbÂleme in der koopÂerÂaÂtivÂen SpieltheÂoÂrie dienen, wo GrupÂpen von AgenÂten gemeinÂsam Ziele verÂfolÂgen.
VorhanÂdene SprachÂmodÂelle zeigen bereÂits einige strateÂgisÂche DenkÂfähigkeitÂen, diese sind jedoch oft heurisÂtisch und nicht immer zuverÂläsÂsig in komÂplexÂen SitÂuÂaÂtioÂnen. Ein gezieltes TrainÂing könÂnte ihre strateÂgisÂchen FähigkeitÂen verbessern. StrateÂgisÂche AgenÂten benötiÂgen FähigkeitÂen, die ĂĽber die wörtliche InterÂpreÂtaÂtion hinÂausÂgeÂhen, um die AbsichtÂen und BedeuÂtunÂgen in Gesprächen zu verÂsteÂhen. WeitÂerÂfĂĽhrende Forschung ist nötig, um diese FähigkeitÂen in verÂschiedeÂnen komÂmuÂnikaÂtivÂen KonÂtexÂten zu entwickÂeln. EmerÂgent ComÂmuÂniÂcaÂtion könÂnte helfen, pragÂmaÂtisÂche FähigkeitÂen durch InterÂakÂtion zu fördern, allerdÂings ist es unreÂalÂisÂtisch zu erwarten, dass menÂschliche Sprache nur durch InterÂakÂtion vollÂständig entsteÂht.