DeepSeek обновила V3-модель ИИ

08:36, 25 марта

Отредактировано: Veronika Radoslavskaya

Китайская компания DeepSeek представила обновлённую языковую модель DeepSeek-V3-0324, доступную для использования на платформе Hugging Face. Модель построена на архитектуре MoE (Mixture of Experts — смесь экспертов) и содержит 236 миллиардов активируемых параметров (из общего количества в 685 миллиардов). Благодаря этой структуре модель активирует только часть параметров при каждом запросе, что позволяет значительно снизить вычислительные затраты без ущерба для качества генерации.

DeepSeek-V3-0324 была обучена на специально отобранных текстах на английском и китайском языках, что позволяет ей уверенно работать в двуязычной среде. Она продемонстрировала высокий уровень понимания контекста, способность к логическим рассуждениям и программированию, а также улучшенную точность при решении сложных задач.

Модель поддерживает функции чат-бота, генерацию и обработку текста, и может быть использована в различных прикладных сферах — от образования и исследований до создания интеллектуальных помощников и программной автоматизации. Благодаря открытому доступу через Hugging Face, разработчики могут интегрировать её в собственные приложения или использовать для тестирования новых решений в области ИИ.

Читайте больше новостей по этой теме:

25 марта

Google представила Gemini 2.5: прорыв в области ИИ-рассуждений и кодирования

20 марта

Nvidia представила GR00T N1: настраиваемую модель ИИ для гуманоидных роботов

06 марта

Alibaba представила QwQ-32B, новую модель ИИ с открытым исходным кодом, конкурирующую с DeepSeek-R1

Вы нашли ошибку или неточность?

Мы учтем ваши комментарии как можно скорее.