OpenAI lance le modèle IA avancé o3 avec des capacités d'auto-vérification

Édité par : Veronika Nazarova

OpenAI a dévoilé son nouveau modèle d'IA, o3, successeur de la série o1 précédente. Cette nouvelle série comprend o3 et une variante plus petite, o3-mini, conçue pour des tâches spécifiques.

Le modèle o2 a été omis pour éviter toute confusion avec le fournisseur de télécommunications britannique O2. Bien que les deux modèles ne soient pas encore largement disponibles, les chercheurs en sécurité informatique peuvent demander un accès dès maintenant, avec le lancement prévu d'o3-mini pour la fin janvier, suivi d'o3.

OpenAI utilise une nouvelle technique appelée 'alignement réfléchi' pour empêcher les tentatives de tromperie des utilisateurs. Contrairement à la plupart des modèles d'IA, o3 effectue des auto-vérifications, ce qui aide à atténuer les problèmes courants rencontrés par les systèmes d'IA.

Ce processus de vérification peut entraîner des retards, car o3 prend plus de temps—de plusieurs secondes à une minute—pour parvenir à des solutions. Cependant, il est généralement plus fiable dans des domaines tels que la physique, la science et les mathématiques.

Formé par apprentissage par renforcement, o3 peut 'penser' avant de répondre en utilisant ce qu'OpenAI décrit comme une 'chaîne de pensée privée.' Après avoir reçu une requête, o3 fait une pause pour considérer des questions connexes et explique son raisonnement avant de résumer ce qu'il considère comme la réponse la plus précise.

En termes de performance, o3 a montré une amélioration significative sur le benchmark ARC-AGI, atteignant des résultats trois fois meilleurs que o1 dans des conditions difficiles. Cependant, il a sous-performé sur des tâches très simples, mettant en évidence des différences fondamentales par rapport à l'intelligence humaine.

Dans d'autres tests, o3 a surpassé ses concurrents, bien que les résultats d'évaluation externes provenant de sources en dehors d'OpenAI soient encore attendus.

Avez-vous trouvé une erreur ou une inexactitude ?

Nous étudierons vos commentaires dans les plus brefs délais.