Getting your Trinity Audio player ready...

Von Ralf Keu­per 

Für das Train­ing großer KI-Mod­elle sind in der Regel enorme Daten­men­gen nötig. Das führt wiederum zu hohen Kosten und Inef­fizien­zen. Let­zteres wurde deut­lich, als es einem chi­ne­sis­chen Start­up gelang, mit DeepSeek ein Sprach­mod­ell zu entwick­eln, das mit deut­lich weniger Aufwand und Dat­en entwick­elt wurde, als die bis dahin vorherrschen­den Mod­elle wie Chat­G­PT von Ope­nAI. Auch son­st wer­den fast täglich Stu­di­en oder Pro­to­typen veröf­fentlicht, die in bes­timmten Bere­ichen hohe Effizien­zvorteile ver­sprechen. Es set­zt sich zunehmend die Erken­nt­nis durch, dass Mehr nicht immer bess­er ist und in vie­len Fällen Weniger mehr ist.

Beispiel­haft dafür ist das Konzept der schnellen und sparsamen Heuris­tiken, das von dem Kog­ni­tion­swis­senschaftler Gerd Gigeren­z­er und seinem Team vor eini­gen Jahren in dem Buch Sim­ple Heuris­tics That Make Us Smart vorgestellt wurde. Darin argu­men­tierten sie, dass durch geeignete Faus­tregeln (Heuris­tiken), die sich auf einige wesentliche Merk­male stützen und an die Umwelt angepasst sind, valide Entschei­dun­gen getrof­fen wer­den kön­nen.

Schnelle und sparsame Heuris­tiken nutzen min­i­male Ressourcen für adap­tive Entschei­dun­gen und kön­nen Über­an­pas­sung ver­mei­den. Gigeren­z­er unter­schei­det zwis­chen Strate­gien der Anpas­sung und der Ver­all­ge­meinerung, wobei ein­fache Heuris­tiken oft robuster sind als kom­plexe Mod­elle, da sie weniger anfäl­lig für Über­an­pas­sung sind und sich bess­er an Verän­derun­gen in der Umwelt anpassen kön­nen.

Zusam­menge­fasst betont Gigeren­z­er, dass ein­fache, anpas­sungs­fähige Heuris­tiken in der realen Welt oft effek­ti­vere Entschei­dun­gen ermöglichen als kom­plexe, ressourcenin­ten­sive Mod­elle.

Wichtig­stes Merk­mal ein­er Strate­gie, die für die Ver­all­ge­meinerung ver­wen­det wer­den kann, ist die Robus­theit: „Je mehr Para­me­ter ein Mod­ell hat und je mehr Infor­ma­tio­nen (Hin­weise) es ver­wen­det, desto bess­er passt es zu den gegebe­nen Dat­en. Bei der Ver­all­ge­meinerung hinge­gen ist mehr nicht unbe­d­ingt bess­er. Eine rech­ner­isch ein­fache Strate­gie, die nur einen Teil der ver­füg­baren Infor­ma­tio­nen nutzt, kann robuster sein als eine rech­ner­isch…

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert