DeepSeek a lancé son nouveau modèle AI, DeepSeek-R1, une addition significative au paysage AI open-source. Ce modèle offre des performances comparables à celles des offres d'OpenAI et est publié sous une licence MIT, permettant la distillation gratuite et l'utilisation commerciale.
DeepSeek-R1 est conçu pour égaler les capacités d'OpenAI en matière de raisonnement, de mathématiques et de codage, signalant un changement vers un développement AI plus collaboratif. Le modèle utilise un apprentissage par renforcement avancé avec peu de données étiquetées et adopte une approche de Chaîne de Pensée (CoT), ce qui améliore l'exactitude des réponses et la transparence dans la prise de décision.
Le modèle présente une longueur de contexte maximale de 64 000 tokens et peut générer jusqu'à 32 000 tokens dans les sorties de Chaîne de Pensée, ce qui le rend adapté aux tâches de raisonnement complexes. De plus, DeepSeek a introduit une structure tarifaire par paliers pour son API, allant de 0,14 à 2,19 dollars par million de tokens, favorisant à la fois l'accessibilité et la durabilité.
Ce lancement intervient dans le cadre d'un débat en cours dans l'industrie AI concernant les modèles open-source par rapport aux modèles propriétaires, DeepSeek-R1 émergeant comme un concurrent solide. Sa sortie pourrait redéfinir les perceptions du développement AI, soulignant le potentiel de solutions puissantes et accessibles dans le domaine.