Welcome to KI-Agenten   Klicken, um den Text zu hören Welcome to KI-Agenten

Das größte Poten­zial von KI-Agen­ten liegt, zumin­d­est was die Steigerung der Pro­duk­tiv­ität anbe­langt, laut Andrew Ng, CEO und Grün­der von Landin­gAI, in der Prozes­sautoma­tisierung. Die Fortschritte im Bere­ich der agen­ten­basierten Prozes­sautoma­tisierung seien inzwis­chen beachtlich­er als bei den Foun­da­tion Mod­els; ja — die agen­ten­basierte Prozes­sautoma­tisierung ist bis zu einem beachtlichen Grad unab­hängig von der Weit­er­en­twick­lung der Foun­da­tion Mod­els. Ver­ant­wortlich dafür ist die Ein­bindung iter­a­tiv­er Agen­ten-Work­flows.

In einem Vor­trag erläutert Ng den Unter­schied zwis­chen Non-agen­tic Work­flows (Zero-shot) und agen­tic-Work­flows am Beispiel des Schreibens eines wis­senschaftlichen Essays.

Beim Non-agen­tic Work­flow lautet die Anweisung/der Prompt: Bitte schreibe einen Auf­satz zum The­ma x von Anfang bis Ende in einem Rutsch, ohne die Rück­taste zu benutzen.

  • Beim Agen­tic-Work­flow lautet der Prompt:
  • Schreibe einen Auf­satz zum The­ma x
  • Benötigst du eine Web-Recherche?
  • Schreibe einen ersten Entwurf
  • Über­lege, welche Teile über­ar­beit­et oder weit­er recher­chiert wer­den müssen
    Über­ar­beite deinen ersten Entwurf

Der Agen­tic Work­flow liefert dadurch, dass er mehrere Iter­a­tio­nen durch­läuft und die Entwürfe ein­er Revi­sion unterzieht, deut­lich bessere Ergeb­nisse als dies mit non-agen­tic-Work­flows möglich ist.
Ng und sein Team haben haben die Ergeb­nisse ein­er Rei­he von Forschung­steams analysiert und sich dabei auf die Fähigkeit eines Algo­rith­mus konzen­tri­ert, bei dem weit ver­bre­it­eten Cod­ing Bench­mark HumanEval gut abzuschnei­den:

6c6af316-fec5-43be-b470-0a7cfc5c5caf

GPT‑3.5 (Zero Shot) war zu 48,1 % richtig. GPT‑4 (Zero Shot) schnei­det mit 67,0 % bess­er ab. Die Verbesserung von GPT‑3.5 zu GPT‑4 wird jedoch durch die Ein­bindung eines iter­a­tiv­en Agen­ten-Work­flows in den Schat­ten gestellt. In ein­er Agen­ten­schleife erre­icht GPT‑3.5 sog­ar bis zu 95,1 %.

Quellen:

The Batch

Andrew Ng On AI Agen­tic Work­flows And Their Poten­tial For Dri­ving AI Progress

Hin­weis: Dieser Beitrag wurde zuerst am 21. August 2024 über den ehe­ma­li­gen Provider dieses Blogs veröf­fentlicht.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Klicken, um den Text zu hören