Getting your Trinity Audio player ready...
|
Kürzlich auf den Markt gebrachte „Agenten“ mit künstlicher Intelligenz (KI) können Computer nutzen, indem sie die Kontrolle über Tastatur und Maus übernehmen. Diese KI-Agenten können einen Computer genauso bedienen wie ein Mensch und können Anweisungen in englischer Sprache empfangen. Es wird erwartet, dass diese KI-Agenten bis Ende 2025 alltäglich werden und die Art und Weise, wie wir arbeiten und das Internet nutzen, verändern werden. Wir haben diese KI-Agenten auf die allgemeinen Fähigkeiten geprüft, die zum Spielen von Spielen wie Wordle erforderlich sind: Erkennen, wenn Kacheln die Farbe wechseln, Nutzung von Feedback, um zu fundierten Vermutungen zu gelangen, und Eingabe dieser Vermutungen mit Hilfe der Computertastatur und Maus.
Beitrag
Eine Schlüsselfrage in Bezug auf die Rolle von KI-Agenten ist, ob sie die menschlichen Fähigkeiten verbessern, indem sie als „Co-Piloten“ dienen, oder ob sie gut genug sind, um zu autonomen Werkzeugen zu werden, die die menschlichen Bediener ersetzen können. Unser Test soll Licht in diese Frage bringen. KI-Agenten zeigen beeindruckende Fähigkeiten bei eng definierten Aufgaben wie standardisierten Tests in Mathematik, Medizin und Recht sowie anderen Tests, für die sie trainiert werden können. Für allgemeine Aufgaben in der realen Welt ist jedoch mehr erforderlich. Um reale Aufgaben zu bewältigen, müssen KI-Agenten viele zusammenhängende Aufgaben lösen, komplexe Situationen verstehen, mit Unstimmigkeiten umgehen und vor allem in der Lage sein, sich selbst zu bewerten, zu experimentieren und automatisch zu korrigieren. Wir haben KI-Agenten gebeten, mit Tastatur und Maus Spiele wie Wordle zu spielen, um herauszufinden, wie sie sich im Vergleich zu Menschen schlagen.
Ergebnisse
Wir haben festgestellt, dass KI-Agenten in den wichtigsten Aspekten unzureichend sind. Sie sind beeindruckend bei eng umrissenen Aufgaben. Aber es fehlt ihnen an Selbsterkenntnis, um zu wissen, wann sie etwas falsch gemacht haben und ihren Kurs im Lichte der Beweise zu ändern, und es fehlt ihnen die Fähigkeit, auf optimale Weise zu experimentieren, um ihre Unwissenheit zu beheben. Bei einigen sich wiederholenden Aufgaben machen sie zu viele Fehler, was den Fortschritt bei der Lösung des Gesamtproblems verlangsamt. Auch Menschen machen solche Fehler, aber sie sind in der Lage, sich von diesen Fehlern zu erholen. Im Gegensatz dazu bleiben KI-Agenten stecken, weil sie nicht experimentieren und aus ihren Fehlern lernen können. Auch wenn künftige Generationen von KI-Agenten diese Mängel überwinden können, werden KI-Agenten in naher Zukunft wahrscheinlich eher als Co-Piloten eingesetzt, die die Arbeit menschlicher Bediener ergänzen, als als autonome Agenten, die menschliche Arbeitskräfte verdrängen.
Quelle: Putting AI agents through their paces on general tasks