DeepSeek Lancement du Modèle AI Open-Source DeepSeek-R1

18:53, 20 janvier

Édité par : Veronika Nazarova

DeepSeek a lancé son nouveau modèle AI, DeepSeek-R1, une addition significative au paysage AI open-source. Ce modèle offre des performances comparables à celles des offres d'OpenAI et est publié sous une licence MIT, permettant la distillation gratuite et l'utilisation commerciale.

DeepSeek-R1 est conçu pour égaler les capacités d'OpenAI en matière de raisonnement, de mathématiques et de codage, signalant un changement vers un développement AI plus collaboratif. Le modèle utilise un apprentissage par renforcement avancé avec peu de données étiquetées et adopte une approche de Chaîne de Pensée (CoT), ce qui améliore l'exactitude des réponses et la transparence dans la prise de décision.

Le modèle présente une longueur de contexte maximale de 64 000 tokens et peut générer jusqu'à 32 000 tokens dans les sorties de Chaîne de Pensée, ce qui le rend adapté aux tâches de raisonnement complexes. De plus, DeepSeek a introduit une structure tarifaire par paliers pour son API, allant de 0,14 à 2,19 dollars par million de tokens, favorisant à la fois l'accessibilité et la durabilité.

Ce lancement intervient dans le cadre d'un débat en cours dans l'industrie AI concernant les modèles open-source par rapport aux modèles propriétaires, DeepSeek-R1 émergeant comme un concurrent solide. Sa sortie pourrait redéfinir les perceptions du développement AI, soulignant le potentiel de solutions puissantes et accessibles dans le domaine.

Lisez plus d’actualités sur ce sujet :

06 mai

Alibaba unveils Qwen3, a new open-source AI model family

05 mai

Freepik Launches F Lite, an Open-Source AI Image Model Trained on Licensed Data

24 avril

DeepSeek Upgrades V3 AI Model

Avez-vous trouvé une erreur ou une inexactitude ?

Nous étudierons vos commentaires dans les plus brefs délais.