Alibaba представила QwQ-32B, новую модель ИИ с открытым исходным кодом, конкурирующую с DeepSeek-R1

Отредактировано: Ольга Паничкина

Акции Alibaba Group резко выросли после выпуска QwQ-32B, новой модели логического вывода ИИ с открытым исходным кодом. Модель по производительности конкурирует с DeepSeek-R1, но значительно меньше: 32,5 миллиарда параметров против 671 миллиарда у R1 (хотя R1 активирует только 37 миллиардов за раз). QwQ-32B, основанная на архитектуре Transformer, включает в себя ротационное позиционное кодирование для улучшения понимания текста. Она может обрабатывать запросы с количеством токенов до 131 072 и превосходно справляется с задачами кодирования, математики и внешних приложений. Разработанная с использованием обучения с подкреплением, QwQ-32B превзошла R1 в тестах, измеряющих взаимодействие с внешними системами, ответы на вопросы и выравнивание выходных данных. Этот выпуск последовал за обязательством Alibaba инвестировать 53 миллиарда долларов в инфраструктуру ИИ в течение следующих трех лет. Другие китайские технологические гиганты, такие как Tencent, также уделяют приоритетное внимание разработке LLM, что подчеркивает растущую гонку ИИ в Китае.

Вы нашли ошибку или неточность?

Мы учтем ваши комментарии как можно скорее.