阿里巴巴推出 QwQ-32B,一款可與 DeepSeek-R1 相媲美的新型開源人工智慧模型

编辑者: Ольга Паничкина

阿里巴巴集團發布了新型開源人工智慧推理模型 QwQ-32B 後,股價飆升。該模型在效能上可與 DeepSeek-R1 相媲美,但規模明顯更小,參數為 325 億個,而 R1 為 6710 億個(儘管 R1 一次僅啟動 370 億個)。 QwQ-32B 基於 Transformer 架構,結合了旋轉位置編碼,以提高文字理解能力。它可以處理最多 131,072 個符記的提示,並且擅長編碼、數學和外部應用程式任務。QwQ-32B 使用強化學習開發,在衡量外部系統互動、問題解答和輸出對齊的基準測試中優於 R1。 在此版本發布之前,阿里巴巴承諾在未來三年內投資 530 億美元用於人工智慧基礎設施。騰訊等其他中國科技巨頭也優先發展 LLM,凸顯了中國日益激烈的人工智慧競賽。

发现错误或不准确的地方吗?

我们会尽快处理您的评论。