Getting your Trinity Audio player ready...

Das Doku­ment mit dem Titel „Build the web for agents, not agents for the web“  schlägt einen Par­a­dig­men­wech­sel in der Forschung zu Web-Agen­ten vor. Es argu­men­tiert, dass aktuelle Ansätze, die Web-Agen­ten zwin­gen, mit für Men­schen konzip­ierten Schnittstellen zu inter­agieren, erhe­bliche Ein­schränkun­gen aufweisen. Diese Ein­schränkun­gen umfassen die Kom­plex­ität von Web-Eingaben wie riesige DOM-Bäume, die man­gel­nde Voll­ständigkeit von Screen­shots und die Gren­zen von API-Inter­ak­tio­nen.

Als Lösung wird das Konzept der Agen­tic Web Inter­faces (AWIs) einge­führt, Schnittstellen, die speziell für die Nav­i­ga­tion durch Agen­ten opti­miert sind. AWIs sollen die Darstel­lung­sein­schränkun­gen und Ressourcenher­aus­forderun­gen browser­basiert­er Web-Agen­ten beheben, indem sie maßgeschnei­derte Brows­er-Zus­tands­darstel­lun­gen bere­it­stellen, die wed­er über­flüs­sige Details enthal­ten noch umfassende DOM-Infor­ma­tio­nen ver­mis­sen lassen. Dies würde die Rechenkosten erhe­blich senken und die Sicher­heit verbessern, indem der Zugriff auf sen­si­ble Infor­ma­tio­nen und aus­führbare Aktio­nen kon­trol­liert wer­den.

Das Papi­er stellt sechs Leit­prinzip­i­en für das Design von AWIs vor: Stan­dar­d­isierung, Men­schen­zen­trierung, Sicher­heit, opti­male Darstel­lun­gen, Host­ing-Effizienz und Entwick­ler­fre­undlichkeit. Es wer­den auch konkrete Vorschläge gemacht, wie z.B. vere­in­heitlichte Aktio­nen auf höher­er Ebene, Kom­pat­i­bil­ität mit Benutze­r­ober­flächen, Zugriff­skon­trollen für Agen­ten, pro­gres­sive Infor­ma­tion­süber­tra­gung und Agen­ten-Auf­gaben­warteschlangen.

Die Autoren beto­nen, dass die Entwick­lung von AWIs eine gemein­same Anstren­gung der gesamten ML-Com­mu­ni­ty erfordert, ein­schließlich der Bere­iche Human-cen­tric AI (HCAI), KI-Sicher­heit, Nat­ur­al Lan­guage Pro­cess­ing (NLP), Mul­ti­modal­ität, Rein­force­ment Learn­ing, Pla­nung und Gen­er­al­isierung. Dies soll sich­er­stellen, dass AWIs von Anfang an Test‑, Debug­ging- und Sicher­heits­funk­tio­nen inte­gri­eren, anstatt diese nachträglich einzubauen. AWIs unter­schei­den sich grundle­gend von Kom­mu­nika­tion­spro­tokollen wie dem Mod­el Con­text Pro­to­col (MCP), da AWIs Schnittstellen für die Nav­i­ga­tion von zus­tands­be­hafteten Web­seit­en sind, während MCP ein Pro­tokoll für die Kom­mu­nika­tion zwis­chen LLM-Agen­ten und Tools ist.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert