Alibaba stellt QwQ-32B vor, ein neues Open-Source-KI-Modell, das mit DeepSeek-R1 konkurriert

Bearbeitet von: Ольга Паничкина

Die Aktien der Alibaba Group stiegen nach der Veröffentlichung von QwQ-32B, einem neuen Open-Source-KI-Modell für logisches Denken, sprunghaft an. Das Modell konkurriert in seiner Leistung mit DeepSeek-R1, ist aber mit 32,5 Milliarden Parametern deutlich kleiner als R1 mit 671 Milliarden (obwohl R1 jeweils nur 37 Milliarden aktiviert). QwQ-32B, das auf der Transformer-Architektur basiert, enthält eine rotierende Positionskodierung für ein verbessertes Textverständnis. Es kann Prompts mit bis zu 131.072 Token verarbeiten und zeichnet sich durch Codierung, Mathematik und Aufgaben in externen Anwendungen aus. QwQ-32B wurde mithilfe von Reinforcement Learning entwickelt und übertraf R1 in Benchmarks, die die Interaktion mit externen Systemen, die Beantwortung von Fragen und die Ausrichtung der Ausgabe messen. Diese Veröffentlichung folgt auf Alibabas Zusage, in den nächsten drei Jahren 53 Milliarden US-Dollar in die KI-Infrastruktur zu investieren. Andere chinesische Technologiegiganten wie Tencent priorisieren ebenfalls die LLM-Entwicklung, was das wachsende KI-Rennen in China unterstreicht.

Haben Sie einen Fehler oder eine Ungenauigkeit festgestellt?

Wir werden Ihre Kommentare so schnell wie möglich berücksichtigen.