OpenAI a introduit o1, son modèle d'IA de raisonnement, à certains développeurs à partir de mardi. Ce déploiement cible ceux de la catégorie d'utilisation 'niveau 5', nécessitant un minimum de dépenses de 1 000 $ et un compte âgé de plus de 30 jours.
Remplaçant le modèle précédent o1-preview, o1 offre des capacités de vérification des faits améliorées, contribuant à atténuer les pièges courants des modèles d'IA. Cependant, cette amélioration a un coût, car le modèle nécessite généralement plus de temps de traitement et de ressources, OpenAI facturant 15 $ pour environ 750 000 mots d'analyse et 60 $ pour le contenu généré, ce qui est considérablement plus élevé que son prédécesseur, GPT-4o.
Le nouveau modèle o1 est beaucoup plus personnalisable, avec des fonctionnalités telles que l'appel de fonction, la messagerie des développeurs pour les instructions de ton et de style, et l'analyse d'images. Il introduit également un paramètre API, 'reasoning_effort', permettant aux développeurs de contrôler le temps de traitement du modèle avant de répondre.
OpenAI décrit cette version de o1 comme un modèle 'nouveau post-entraîné', promettant des réponses plus complètes et précises, en particulier dans les questions de programmation et d'affaires. La société élargit progressivement l'accès tout en améliorant les limites d'utilisation.
Dans des nouvelles connexes, OpenAI a annoncé de nouvelles versions de ses mini-modèles, GPT-4o et GPT-4o, dans son API Realtime, qui reste en version bêta mais a ajouté des fonctionnalités telles que des réponses simultanées hors bande. L'API prend désormais en charge WebRTC, facilitant les applications vocales en temps réel sur divers appareils.
L'intégration de WebRTC par OpenAI vise à garantir des interactions fluides dans des conditions réelles, gérant l'encodage audio, le streaming, la suppression du bruit et le contrôle de la congestion. De plus, la société a affiné ses préférences d'API de réglage fin et lancé une version bêta pour les SDK officiels en Go et Java.