Getting your Trinity Audio player ready...
|
Das Qwen-Team von Alibaba hat kürzlich das neue KI-Modell QwQ-32B vorgestellt, ein 32-Milliarden-Parameter-Modell, das mithilfe von Reinforcement Learning (RL) entwickelt wurde, um die Leistung bei komplexen Problemlösungsaufgaben zu verbessern. Das Modell ist als Open-Weight auf Hugging Face und ModelScope unter einer Apache 2.0 Lizenz verfügbar, was kommerzielle und Forschungsanwendungen ermöglicht1Alibaba’s new open source model QwQ-32B matches DeepSeek-R1 with way smaller compute requirements.
QwQ-32B baut auf dem zuvor im November 2024 eingeführten Qwen-with-Questions (QwQ) auf. Es verbessert logisches Denken und Planung, indem es seine eigenen Antworten während der Inferenz überprüft und verfeinert. Das Modell hat eine Kontextlänge von 131.072 Tokens, was eine bessere Handhabung langer Eingabesequenzen ermöglicht.
Das Qwen-Team hat ein mehrstufiges RL-Training implementiert, um die mathematische und programmiertechnische Leistungsfähigkeit zu steigern. Trotz weniger Parameter zeigt QwQ-32B konkurrenzfähige Ergebnisse im Vergleich zu Modellen wie DeepSeek-R1.
Für Unternehmen stellt QwQ-32B eine Alternative dar, da es genauere, kontextbewusste Einblicke bietet, die für verschiedene Anwendungsfälle wie automatisierte Datenanalyse und strategische Planung genutzt werden können. Die offene Verfügbarkeit des Modells ermöglicht eine Anpassung für spezifische Anwendungen ohne proprietäre Einschränkungen.