Putting AI agents through their paces on general tasks

Getting your Trinity Audio player ready...

Kürzlich auf den Markt gebrachte „Agenten“ mit künstlicher Intelligenz (KI) können Computer nutzen, indem sie die Kontrolle über Tastatur und Maus übernehmen. Diese KI-Agenten können einen Computer genauso bedienen wie ein Mensch und können Anweisungen in englischer Sprache empfangen. Es wird erwartet, dass diese KI-Agenten bis Ende 2025 alltäglich werden und die Art und Weise, wie wir arbeiten und das Internet nutzen, verändern werden. Wir haben diese KI-Agenten auf die allgemeinen Fähigkeiten geprüft, die zum Spielen von Spielen wie Wordle erforderlich sind: Erkennen, wenn Kacheln die Farbe wechseln, Nutzung von Feedback, um zu fundierten Vermutungen zu gelangen, und Eingabe dieser Vermutungen mit Hilfe der Computertastatur und Maus.

Beitrag

Eine Schlüsselfrage in Bezug auf die Rolle von KI-Agenten ist, ob sie die menschlichen Fähigkeiten verbessern, indem sie als „Co-Piloten“ dienen, oder ob sie gut genug sind, um zu autonomen Werkzeugen zu werden, die die menschlichen Bediener ersetzen können. Unser Test soll Licht in diese Frage bringen. KI-Agenten zeigen beeindruckende Fähigkeiten bei eng definierten Aufgaben wie standardisierten Tests in Mathematik, Medizin und Recht sowie anderen Tests, für die sie trainiert werden können. Für allgemeine Aufgaben in der realen Welt ist jedoch mehr erforderlich. Um reale Aufgaben zu bewältigen, müssen KI-Agenten viele zusammenhängende Aufgaben lösen, komplexe Situationen verstehen, mit Unstimmigkeiten umgehen und vor allem in der Lage sein, sich selbst zu bewerten, zu experimentieren und automatisch zu korrigieren. Wir haben KI-Agenten gebeten, mit Tastatur und Maus Spiele wie Wordle zu spielen, um herauszufinden, wie sie sich im Vergleich zu Menschen schlagen.

Ergebnisse

Wir haben festgestellt, dass KI-Agenten in den wichtigsten Aspekten unzureichend sind. Sie sind beeindruckend bei eng umrissenen Aufgaben. Aber es fehlt ihnen an Selbsterkenntnis, um zu wissen, wann sie etwas falsch gemacht haben und ihren Kurs im Lichte der Beweise zu ändern, und es fehlt ihnen die Fähigkeit, auf optimale Weise zu experimentieren, um ihre Unwissenheit zu beheben. Bei einigen sich wiederholenden Aufgaben machen sie zu viele Fehler, was den Fortschritt bei der Lösung des Gesamtproblems verlangsamt. Auch Menschen machen solche Fehler, aber sie sind in der Lage, sich von diesen Fehlern zu erholen. Im Gegensatz dazu bleiben KI-Agenten stecken, weil sie nicht experimentieren und aus ihren Fehlern lernen können. Auch wenn künftige Generationen von KI-Agenten diese Mängel überwinden können, werden KI-Agenten in naher Zukunft wahrscheinlich eher als Co-Piloten eingesetzt, die die Arbeit menschlicher Bediener ergänzen, als als autonome Agenten, die menschliche Arbeitskräfte verdrängen.

Quelle: Putting AI agents through their paces on general tasks

Putting AI agents through their paces on general tasks

Ähnliche Beiträge

EMBODIED WEB AGENTS: Die Verschmelzung von physischer und digitaler KI-Intelligenz

Eine kritische Analyse der Fähigkeiten und Grenzen von KI-Reasoning-Modellen

Generative KI und Agentensysteme für Finanzwirtschaft, Verwaltung und weitere Branchen

Schreibe einen Kommentar Antworten abbrechen

Putting AI agents through their paces on general tasks

Ähnliche Beiträge:

Ähnliche Beiträge

EMBODIED WEB AGENTS: Die Verschmelzung von physischer und digitaler KI-Intelligenz

Eine kritische Analyse der Fähigkeiten und Grenzen von KI-Reasoning-Modellen

Generative KI und Agentensysteme für Finanzwirtschaft, Verwaltung und weitere Branchen

Schreibe einen Kommentar Antworten abbrechen