Das Shang­hai AI Lab­o­ra­to­ry präsen­tiert mit Intern-S1 ein rev­o­lu­tionäres mul­ti­modales Foun­da­tion Mod­el, das speziell für wis­senschaftliche Anwen­dun­gen entwick­elt wurde. Mit 28 Mil­liar­den aktivierten Para­me­tern und ein­er inno­v­a­tiv­en Mix­ture-of-Experts-Architek­tur schließt es die Lücke zwis­chen Open-Source- und pro­pri­etären Mod­ellen. Beson­ders bemerkenswert: Intern-S1 über­trifft erst­mals geschlossene Sys­teme in wis­senschaftlichen Bench­marks und macht mod­ern­ste KI-Tech­nolo­gie für die Forschungs­ge­mein­schaft frei zugänglich.


Die Wis­senschaft braucht bessere KI-Werkzeuge

Die wis­senschaftliche Forschung ste­ht vor einem Para­dox: Während kün­stliche Intel­li­genz in vie­len Bere­ichen bere­its trans­for­ma­tive Erfolge erzielt, bleiben spezial­isierte wis­senschaftliche Anwen­dun­gen oft unter­ver­sorgt. Open-Source-Mod­elle, die Herzstück demokratis­ch­er Forschung, hinken in kom­plex­en, date­n­ar­men wis­senschaftlichen Domä­nen deut­lich hin­ter kom­merziellen Lösun­gen hin­ter­her. Diese Diskrepanz bremst nicht nur den wis­senschaftlichen Fortschritt, son­dern ver­stärkt auch die dig­i­tale Kluft zwis­chen ressourcenstarken Insti­tu­tio­nen und kleineren Forschungs­grup­pen.

Das Shang­hai AI Lab­o­ra­to­ry hat diese Her­aus­forderung erkan­nt und mit Intern-S1 eine Antwort entwick­elt, die das Poten­zial hat, die Land­schaft wis­senschaftlich­er KI-Anwen­dun­gen grundle­gend zu verän­dern. Das am 21. August 2025 vorgestellte Mod­ell verkör­pert einen ambi­tion­ierten Ansatz: Es soll nicht nur die beste­hende Lücke schließen, son­dern auch als Grund­stein für die Entwick­lung ein­er wis­senschaftlich ori­en­tierten Arti­fi­cial Gen­er­al Intel­li­gence (AGI) dienen.

Architek­tur für die Kom­plex­ität der Wis­senschaft

Intern-S1 basiert auf ein­er aus­gek­lügel­ten Mix­ture-of-Experts-Architek­tur, die 28 Mil­liar­den aktivierte Para­me­ter aus einem Pool von 241 Mil­liar­den Gesamt­pa­ra­me­tern nutzt. Diese Struk­tur ermöglicht es dem Mod­ell, je nach Auf­gaben­stel­lung die rel­e­van­testen Experten­mod­ule zu aktivieren – ein entschei­den­der Vorteil bei der Ver­ar­beitung der het­ero­ge­nen Daten­land­schaft wis­senschaftlich­er Forschung.

Die tech­nis­che Inno­va­tion liegt jedoch nicht nur in der schieren Größe, son­dern in der durch­dacht­en mul­ti­modalen Inte­gra­tion. Ein Vision Trans­former ver­ar­beit­et kom­plexe wis­senschaftliche Visu­al­isierun­gen und Dia­gramme, während ein dynamis­ch­er Tok­eniz­er speziell für wis­senschaftliche For­mate wie SMILES-Nota­tion für chemis­che Struk­turen oder FAS­TA-Sequen­zen für biol­o­gis­che Dat­en opti­miert wurde. Ein Zeitrei­hen-Encoder kom­plet­tiert die Architek­tur und ermöglicht die Analyse numerisch­er Daten­ströme aus seis­mis­chen Mes­sun­gen oder astronomis­chen Beobacht…

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert