Welcome to KI-Agenten   Klicken, um den Text zu hören Welcome to KI-Agenten
emergenz

Große Sprach­mod­elle wer­den in erster Lin­ie durch selb­stüberwacht­es Ler­nen trainiert. Dabei ler­nen die Mod­elle, Muster und Zusam­men­hänge in großen Textmen­gen zu erken­nen, ohne dass explizite Anno­ta­tio­nen erforder­lich sind. Das wiederum ermöglicht es ihnen, kon­textab­hängige Infor­ma­tio­nen aus den Train­ings­dat­en zu extrahieren. Durch sog. Free-Shot-Prompt­ing kön­nen LLMs aus der Eingabeauf­forderung ler­nen, ohne dass weit­ere Para­me­ter hinzuge­fügt wer­den müssen. Da sie aus weni­gen Beispie­len ler­nen, kön­nen LLMs sich schnell an neue Kon­texte anpassen.

Mit­tler­weile ste­ht die Behaup­tung im Raum, dass große Sprach­mod­elle, die Mil­liar­den von Para­me­tern enthal­ten und auf umfan­gre­ichen Webko­r­po­ra trainiert wur­den, bes­timmte Fähigkeit­en erlan­gen, ohne dass sie spez­i­fisch darauf trainiert wur­den. Diese Fähigkeit­en wer­den als „emer­gente Fähigkeit­en“ beze­ich­net.

Eine zen­trale Her­aus­forderung bei der Bew­er­tung emer­gen­ter Fähigkeit­en beste­ht laut den Autoren von Are Emer­gent Abil­i­ties in Large Lan­guage Mod­els just In-Con­text Learn­ing? darin, dass sie durch Mod­el­lkom­pe­ten­zen beein­trächtigt wer­den, ein­schließlich des kon­textbe­zo­ge­nen Ler­nens (ICL).

Unter emer­gen­ten Fähigkeit­en ver­ste­hen die Autoren, “dass LLMs eine Auf­gabe ober­halb der Basis­lin­ie aus­führen und zwar auf eine Art und Weise, die nicht auf der Grund­lage der Leis­tung kleiner­er Mod­elle vorherge­sagt wer­den kann”. Das Mod­ell ver­fügt auf ein­mal über neu auf­tauchende Fähigkeit­en — in diesem Fall logisch zu denken — die es zu vor nicht besessen hat — es ver­hält sich nicht vorherse­hbar. Ein neues Ver­hal­ten, das bis dahin nicht beobachtet wurde.

Die Autoren kom­men zu dem Schluss, dass “ver­meintlich emer­gente Fähigkeit­en nicht wirk­lich emer­gent sind, son­dern aus ein­er Kom­bi­na­tion von kon­textbe­zo­gen­em Ler­nen, Mod­ellgedächt­nis und sprach­lichem Wis­sen resul­tieren. … Die Fähigkeit, Anweisun­gen zu befol­gen, bedeutet nicht, dass man über logis­che Fähigkeit­en ver­fügt, und, was noch wichtiger ist, sie bedeutet nicht, dass latente, poten­ziell gefährliche Fähigkeit­en vorhan­den sind”.

Quellen und weit­ere Infor­ma­tio­nen:

IBM and RPI researchers demys­ti­fy in-con­text learn­ing in large lan­guage mod­els

In-Con­text Learn­ing bei LLMs: Eine Ein­führung

Hin­weis: Dieser Beitrag wurde zuerst am 27. August 2024 über den ehe­ma­li­gen Provider dieses Blogs veröf­fentlicht.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Klicken, um den Text zu hören