DeepSeek ha lanzado su nuevo modelo AI, DeepSeek-R1, una adición significativa al panorama de AI de código abierto. Este modelo ofrece un rendimiento comparable a las ofertas de OpenAI y se publica bajo una licencia MIT, permitiendo la destilación gratuita y el uso comercial.
DeepSeek-R1 está diseñado para igualar las capacidades de OpenAI en razonamiento, matemáticas y programación, señalando un cambio hacia un desarrollo de AI más colaborativo. El modelo utiliza un aprendizaje por refuerzo avanzado con datos etiquetados mínimos y emplea un enfoque de Cadena de Pensamiento (CoT), que mejora la precisión de las respuestas y la transparencia en la toma de decisiones.
El modelo cuenta con una longitud máxima de contexto de 64,000 tokens y puede generar hasta 32,000 tokens en salidas de Cadena de Pensamiento, lo que lo hace adecuado para tareas de razonamiento complejas. Además, DeepSeek ha introducido una estructura de precios escalonada para su API, que va de $0.14 a $2.19 por millón de tokens, promoviendo tanto la accesibilidad como la sostenibilidad.
Este lanzamiento se produce en medio de un debate en curso en la industria de AI sobre modelos de código abierto frente a modelos propietarios, con DeepSeek-R1 emergiendo como un fuerte competidor. Su lanzamiento podría redefinir las percepciones sobre el desarrollo de AI, enfatizando el potencial de soluciones poderosas y accesibles en el campo.