阿里巴巴发布 QwQ-32B，一款可与 DeepSeek-R1 相媲美的新型开源人工智能模型

20:38, 06 三月

编辑者： Ольга Паничкина

阿里巴巴集团发布了新型开源人工智能推理模型 QwQ-32B 后，股价飙升。该模型在性能上可与 DeepSeek-R1 相媲美，但规模明显更小，参数为 325 亿个，而 R1 为 6710 亿个（尽管 R1 一次仅激活 370 亿个）。 QwQ-32B 基于 Transformer 架构，结合了旋转位置编码，以提高文本理解能力。它可以处理最多 131,072 个令牌的提示，并且擅长编码、数学和外部应用程序任务。QwQ-32B 使用强化学习开发，在衡量外部系统交互、问题解答和输出对齐的基准测试中优于 R1。在此版本发布之前，阿里巴巴承诺在未来三年内投资 530 亿美元用于人工智能基础设施。腾讯等其他中国科技巨头也优先发展 LLM，凸显了中国日益激烈的人工智能竞赛。

通知中心

阿里巴巴发布 QwQ-32B，一款可与 DeepSeek-R1 相媲美的新型开源人工智能模型

阅读更多关于该主题的新闻：