阿里巴巴集团发布了新型开源人工智能推理模型 QwQ-32B 后,股价飙升。该模型在性能上可与 DeepSeek-R1 相媲美,但规模明显更小,参数为 325 亿个,而 R1 为 6710 亿个(尽管 R1 一次仅激活 370 亿个)。 QwQ-32B 基于 Transformer 架构,结合了旋转位置编码,以提高文本理解能力。它可以处理最多 131,072 个令牌的提示,并且擅长编码、数学和外部应用程序任务。QwQ-32B 使用强化学习开发,在衡量外部系统交互、问题解答和输出对齐的基准测试中优于 R1。 在此版本发布之前,阿里巴巴承诺在未来三年内投资 530 亿美元用于人工智能基础设施。腾讯等其他中国科技巨头也优先发展 LLM,凸显了中国日益激烈的人工智能竞赛。
阿里巴巴发布 QwQ-32B,一款可与 DeepSeek-R1 相媲美的新型开源人工智能模型
编辑者: Ольга Паничкина
阅读更多关于该主题的新闻:
你发现了错误或不准确的地方吗?
我们会尽快考虑您的意见。