OpenAI a présenté HealthBench le 13 mai 2025, un nouvel ensemble de données destiné à évaluer les modèles d'IA dans le domaine de la santé. L'objectif est de créer un médecin IA disponible 24 heures sur 24 et 7 jours sur 7, accessible via un appareil de poche. Cette initiative évalue la capacité de l'IA à fournir des conseils médicaux fiables. HealthBench est un ensemble de données open source qui compare les modèles d'IA à des rubriques rédigées par des médecins. Le modèle de raisonnement o3 d'OpenAI est en tête avec un score de 60 %. Grok suit avec 54 %, et Gemini 2.5 Pro de Google obtient un score de 52 %. La vision d'un médecin IA disponible 24 heures sur 24 et 7 jours sur 7 pourrait révolutionner l'accessibilité aux soins de santé, en particulier dans les zones reculées. Cependant, la nature gourmande en ressources des modèles d'IA pourrait limiter l'accessibilité. Des préoccupations éthiques concernant la confidentialité des données et la désinformation existent également.
OpenAI Lance HealthBench pour Évaluer les Modèles d'IA dans le Secteur de la Santé
Édité par : Veronika Nazarova
Lisez plus d’actualités sur ce sujet :
Avez-vous trouvé une erreur ou une inexactitude ?
Nous étudierons vos commentaires dans les plus brefs délais.