Alibaba、DeepSeek-R1に対抗する新しいオープンソースAIモデルQwQ-32Bを発表

編集者: Ольга Паничкина

Alibaba Groupの株価は、新しいオープンソースAI推論モデルQwQ-32Bのリリース後、急騰しました。このモデルは、DeepSeek-R1と性能で競合しますが、R1の6710億パラメータと比較して325億パラメータと大幅に小型です(ただし、R1は一度に370億しかアクティブにしません)。 Transformerアーキテクチャに基づくQwQ-32Bは、テキスト理解を向上させるための回転位置エンコーディングを組み込んでいます。最大131,072個のトークンを持つプロンプトを処理でき、コーディング、数学、および外部アプリケーションタスクに優れています。強化学習を使用して開発されたQwQ-32Bは、外部システムインタラクション、質問応答、および出力アライメントを測定するベンチマークでR1を上回りました。 このリリースは、Alibabaが今後3年間でAIインフラストラクチャに530億ドルを投資するというコミットメントに続くものです。Tencentのような他の中国のテクノロジー大手もLLM開発を優先しており、中国でのAI競争の激化を浮き彫りにしています。

エラーや不正確な情報を見つけましたか?

できるだけ早くコメントを考慮します。