Getting your Trinity Audio player ready...
|
Anthropic hat in einem Blogbeitrag Einblicke in die Architektur seines neuen „Research“-Features für das Sprachmodell Claude gegeben. Der Ansatz basiert auf einem Multi-Agenten-System, das Aufgaben parallel löst, anstatt sie linear abzuarbeiten.
Funktionsweise:
Ein Haupt-Agent („Lead-Agent“) zerlegt komplexe Nutzeranfragen in Teilaufgaben und delegiert diese an spezialisierte Unter-Agenten („Sub-Agents“). Diese arbeiten unabhängig, nutzen Werkzeuge wie die Websuche und liefern Ergebnisse, die der Haupt-Agent zusammenführt. Dieser Ansatz steigert die Leistung erheblich und übertrifft in Tests ein einzelnes Top-Modell um über 90 %.
Herausforderungen:
Die hohe Leistung hat ihren Preis: Das System verbraucht bis zu 15-mal mehr Tokens als herkömmliche Chat-Interaktionen, was die Wirtschaftlichkeit limitiert. Zudem ist das System ungeeignet für Aufgaben mit stark voneinander abhängigen Arbeitsschritten, wie etwa Programmierung.
Technische Erkenntnisse:
- Prompt-Engineering: Der Haupt-Agent muss effizient delegieren können, um Doppelarbeit und Detailverluste zu vermeiden.
- Werkzeug-Design: Klare Tool-Beschreibungen sind essenziell, um Fehlleitungen zu verhindern. Ein KI-Agent optimierte diese Beschreibungen und steigerte die Effizienz um 40 %.
- Fehlerkontrolle: Wiederaufnahme-Mechanismen und „Rainbow Deployments“ sorgen für Stabilität bei Fehlern oder Systemupdates.
Bewertung:
Die Ergebnisse werden von einer KI („LLM-as-a-Judge“) bewertet, jedoch bleibt manuelle Kontrolle unverzichtbar.
Der Bericht zeigt die Herausforderungen und Potenziale von Multi-Agenten-Systemen und hebt hervor, dass Fortschritte in der KI zunehmend von intelligenter Orchestrierung statt nur von größerer Modellgröße abhängen.