Акції Alibaba Group різко зросли після випуску QwQ-32B, нової моделі ШІ з відкритим кодом для логічного висновування. Модель конкурує з DeepSeek-R1 за продуктивністю, але значно менша, з 32,5 мільярдами параметрів порівняно з 671 мільярдами R1 (хоча R1 активує лише 37 мільярдів за раз). QwQ-32B, заснована на архітектурі Transformer, включає обертове позиційне кодування для кращого розуміння тексту. Вона може обробляти запити з кількістю токенів до 131 072 і чудово справляється із завданнями кодування, математики та зовнішніх програм. Розроблена з використанням навчання з підкріпленням, QwQ-32B перевершила R1 у тестах, що вимірюють взаємодію із зовнішніми системами, відповіді на запитання та вирівнювання вихідних даних. Цей випуск відбувся після зобов'язання Alibaba інвестувати 53 мільярди доларів в інфраструктуру ШІ протягом наступних трьох років. Інші китайські технологічні гіганти, такі як Tencent, також приділяють пріоритетну увагу розробці LLM, що підкреслює зростаючі перегони ШІ в Китаї.
Alibaba представила QwQ-32B, нову модель ШІ з відкритим кодом, яка конкурує з DeepSeek-R1
Відредаговано: Ольга Паничкина
Читайте більше новин на цю тему:
Знайшли помилку чи неточність?
Ми розглянемо ваші коментарі якомога швидше.