Welcome to KI-Agenten   Klicken, um den Text zu hören Welcome to KI-Agenten

Vor weni­gen Wochen sorgte der zweite jährliche Hal­luz­i­na­tion­sin­dex von Galileo für Auf­se­hen. Darin wur­den 22 führende große Sprach­mod­elle hin­sichtlich ihrer Ten­denz, unge­naue Infor­ma­tio­nen zu gener­ieren, bew­ertet. Zwar lagen die Closed-Source-Mod­elle ins­ge­samt immer noch vorn, doch hat­te sich der Abstand in nur acht Monat­en deut­lich ver­ringert.

Claude 3.5 von Anthrop­ic
Ange­führt wurde der Index von Anthropic’s Claude 3.5 als leis­tungsstärk­stes Mod­ell über alle Auf­gaben hin­weg. Damit zog es an den Ange­boten von Ope­nAI vor­bei, die bis dahin die Ran­gliste dominierten. Die Ver­schiebung wurde als Wach­ablö­sung im KI-Wet­trüsten gedeutet, bei der neuere Mark­t­teil­nehmer die etablierten Mark­t­führer her­aus­fordern.

Qwen2-72B-Instruct von Aliba­ba
Unter den Open Source-Mod­ellen schnitt Qwen2-72B-Instruct von Aliba­ba am besten ab und erzielte hohe Punk­tzahlen bei kurzen und mit­tel­lan­gen Eingaben; ein Beleg dafür, dass nicht-amerikanis­che Unternehmen bedeu­tende Fortschritte in der KI-Entwick­lung machen und die Vorstel­lung von der amerikanis­chen Dom­i­nanz in diesem Bere­ich in Frage stellen.

Ein poten­zieller Wen­depunkt
Der Bericht kam zu dem Befund, dass Open-Source-Mod­elle bess­er und kostengün­stiger wer­den. Unternehmen kön­nten damit leis­tungsstarke KI-Funk­tio­nen ein­set­zen, ohne auf teure pro­pri­etäre Dien­ste zurück­greifen zu müssen. Dies kön­nte zu ein­er weitre­ichen­deren Inte­gra­tion von KI in allen Branchen führen, was die Pro­duk­tiv­ität und Inno­va­tion steigern kön­nte. Branch­en­ex­perten sehen in der Leis­tungssteigerung von Open Source KI-Mod­ellen einen poten­ziellen Wen­depunkt in der Geschichte der KI, ver­gle­ich­bar mit den entschei­den­den Momenten, die in der Ver­gan­gen­heit tech­nol­o­gis­che Rev­o­lu­tio­nen aus­gelöst haben. Die Ver­füg­barkeit von Open-Source-Mod­ellen auf hohem Niveau könne die KI-Entwick­lung weltweit drama­tisch beschle­u­ni­gen und möglicher­weise ganze Branchen umgestal­ten.

MINT-1T von Sales­force
Aufmerk­samkeit zog auch MINT-1T von Sales­force auf sich. Dabei han­delt es sich um einen Open-Source-Daten­satz mit ein­er Bil­lion Text-Token und 3,4 Mil­liar­den Bildern. Der mul­ti­modale, ver­schachtelte Daten­satz, der Text und Bilder in einem For­mat kom­biniert, das reale Doku­mente nachahmt, über­trifft bish­erige öffentlich ver­füg­bare Daten­sätze um das Zehn­fache. Allein die schiere Größe von MINT-1T ist für die Weit­er­en­twick­lung des mul­ti­modalen Ler­nens von großer Bedeu­tung. Beim mul­ti­modalen Ler­nen geht es darum, dass Maschi­nen sowohl Text als auch Bilder gle­ichzeit­ig ver­ste­hen. Dank des Daten­satzes haben kleine Labore und einzelne Forsch­er Zugang zu Dat­en, die mit denen großer Tech­nolo­gie­un­ternehmen konkur­ri­eren kön­nen.

LG Exaone 3.0
Fast zeit­gle­ich präsen­tierte LG AI Research Exaone 3.0, Süd­ko­re­as erstes Open-Source-Mod­ell für kün­stliche Intel­li­genz. Das 7,8‑Milliarden-Parameter-Modell soll die KI-Forschung beschle­u­ni­gen und zum Auf­bau eines robusten KI-Ökosys­tems in Korea beitra­gen. Das Mod­ell wurde mit 60 Mil­lio­nen Fällen pro­fes­sioneller Dat­en aus den Bere­ichen Patente, Codes, Math­e­matik und Chemie trainiert und soll bis zum Jahre­sende auf 100 Mil­lio­nen Fälle aus ver­schiede­nen Bere­ichen erweit­ert wer­den.

LlA­MA 3.1 und Mis­tral Large 2
Lla­ma 3.1 von Meta hat inzwis­chen laut Mark Zucker­berg den Sta­tus eines „Fron­tier-Sys­tems“ erre­icht. Metas frei ver­füg­bare KI sieht sich auf Augen­höhe mit den Sys­te­men von Branchen­führern wie Ope­nAI, Google und Anthrop­ic. Das franzö­sis­che KI-Labor Mis­tral veröf­fentliche Mis­tral Large 2. Das Open-Source KI-Mod­ell soll dem Vernehmen nach mit beste­hen­den Spitzen­sys­te­men mithal­ten oder diese sog­ar übertr­e­f­fen.

Tool­Sand­box von Apple
Ver­gan­gene Woche stell­ten Forsch­er von Apple den neuen Bench­mark Tool­Sand­box vor. Damit kön­nen die Fähigkeit­en von KI-Assis­ten­ten in der realen Welt umfassender als je zuvor bew­erten wer­den. Der Bench­mark enthält drei Schlüs­se­lele­mente, die bei anderen Bench­marks oft fehlen: zus­tandsab­hängige Inter­ak­tio­nen, Kon­ver­sa­tions­fähigkeit­en und dynamis­che Bew­er­tung.

Beim Test ein­er Rei­he von KI-Mod­ellen mit Tool­Sand­box, stell­ten die Forsch­er einen erhe­blichen Leis­tung­sun­ter­schied zwis­chen pro­pri­etären und Open-Source-Mod­ellen fest So waren die pro­pri­etären Lösun­gen den Open-Source-Mod­ellen weit über­legen.

Laut der Studie haben allerd­ings selb­st mod­ern­ste KI-Assis­ten­ten bei kom­plex­en Auf­gaben mit Zus­tandsab­hängigkeit­en, Kanon­isierung (Kon­vertierung von Benutzereingaben in stan­dar­d­isierte For­mate) und Szenar­ien Schwierigkeit­en mit unzure­ichen­den Infor­ma­tio­nen.

Quellen:

Open-source AI nar­rows gap with pro­pri­etary lead­ers, new bench­mark reveals

Apple’s Tool­Sand­box reveals stark real­i­ty: Open-source AI still lags behind pro­pri­etary mod­els

Sil­i­con Val­ley shak­en as open-source AI mod­els Lla­ma 3.1 and Mis­tral Large 2 match indus­try lead­ers

LG unleash­es South Korea’s first open-source AI, chal­leng­ing glob­al tech giants

How Salesforce’s MINT-1T dataset could dis­rupt the AI indus­try

Hin­weis: Dieser Beitrag erschien zuerst am 19. August 2024 über den ehe­ma­li­gen Hoster des Blogs.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Klicken, um den Text zu hören