Welcome to KI-Agenten   Klicken, um den Text zu hören Welcome to KI-Agenten

Das Allen Insti­tute for AI (Ai2) hat mit der Veröf­fentlichung seines neuesten Open-Source-Sprach­mod­ells Tülu 3 405B für Auf­se­hen in der KI-Welt gesorgt. Dieses Mod­ell mit 405 Mil­liar­den Para­me­tern behauptet, die Fähigkeit­en von Ope­nAIs GPT-4o zu erre­ichen und das DeepSeek V3-Mod­ell in wichti­gen Bench­marks zu übertr­e­f­fen. Die Ein­führung markiert einen bedeu­ten­den Fortschritt in der Entwick­lung von Open-Source-KI und baut auf früheren Mod­ellen und Post-Train­ing-Tech­niken von Ai2 auf.

Neuar­tige Tech­nolo­gien

Der Erfolg von Tülu 3 405B basiert auf mehreren Schlüs­selin­no­va­tio­nen. Das Mod­ell nutzt eine Kom­bi­na­tion fortschrit­tlich­er Post-Train­ing-Tech­niken, darunter überwacht­es Fein­tun­ing, Präferen­zler­nen und einen neuar­ti­gen Ansatz des Rein­force­ment Learn­ing. Beson­ders her­vorzuheben ist das Sys­tem des Rein­force­ment Learn­ing from Ver­i­fi­able Rewards (RLVR), das das Mod­ell anhand über­prüf­bar­er Ergeb­nisse, wie etwa der kor­rek­ten Lösung math­e­ma­tis­ch­er Prob­leme, opti­miert. Tech­nis­che Opti­mierun­gen wie effiziente par­al­lele Ver­ar­beitung auf 256 GPUs, opti­mierte Gewichtssyn­chro­ni­sa­tion und eine aus­ge­wo­gene Rechen­verteilung über 32 Knoten tra­gen zur Leis­tungs­fähigkeit des Mod­ells bei.

Leis­tungsver­gle­ich und Open-Source-Ansatz

In ein­er Rei­he von 10 KI-Bench­marks, ein­schließlich Sicher­heits­be­w­er­tun­gen, erzielte das Tülu 3 405B RLVR-Mod­ell eine durch­schnit­tliche Punk­tzahl von 80,7 und über­traf damit DeepSeek V3 mit 75,9 Punk­ten, blieb jedoch knapp hin­ter GPT-4o mit 81,6 Punk­ten zurück. Beson­ders beein­druck­end waren die Ergeb­nisse in Sicher­heits­be­w­er­tun­gen, wo es DeepSeek V3, Lla­ma 3.1 und Nous Her­mes 3 über­traf.

Ai2 hebt sich von anderen “Open-Source”-Modellen ab, indem es nicht nur den gesamten Infra­struk­tur-Code, son­dern auch die Train­ings­dat­en, Mod­ell­gewichte und Evaluierungsmeth­o­d­en zur Ver­fü­gung stellt. Dieser voll­ständig offene Ansatz ermöglicht es Nutzern, die gesamte Pipeline von der Date­nauswahl bis zur Evaluierung anzu­passen.

Ver­füg­barkeit und Bedeu­tung

Inter­essierte kön­nen auf die gesamte Suite der Tülu 3‑Modelle, ein­schließlich Tülu 3–405B, über die Tülu 3‑Seite von Ai2 zugreifen und die Funk­tion­al­ität von Tülu 3–405B im Play­ground-Demobere­ich von Ai2 testen. Diese Veröf­fentlichung stellt einen bedeu­ten­den Schritt in der Entwick­lung von Open-Source-KI dar und hat das Poten­zial, die Kluft zwis­chen offe­nen und geschlosse­nen KI-Mod­ellen zu ver­ringern. Durch die Bere­it­stel­lung leis­tungs­fähiger, frei zugänglich­er Mod­elle und Werkzeuge ermöglicht Ai2 Entwick­lern und Forsch­ern, Leis­tun­gen zu erzie­len, die mit erstk­las­si­gen geschlosse­nen Mod­ellen ver­gle­ich­bar sind, und treibt so die Inno­va­tion im Bere­ich der kün­stlichen Intel­li­genz voran.

Quellen:

Ai2 releas­es Tülu 3, a ful­ly open source mod­el that bests DeepSeek v3, GPT-4o with nov­el post-train­ing approach

Scal­ing the Tülu 3 post-train­ing recipes to sur­pass the per­for­mance of DeepSeek V3

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Klicken, um den Text zu hören