OpenAI Lance HealthBench pour Évaluer les Modèles d'IA dans le Secteur de la Santé

22:13, 13 mai

Édité par : Veronika Radoslavskaya

OpenAI a présenté HealthBench le 13 mai 2025, un nouvel ensemble de données destiné à évaluer les modèles d'IA dans le domaine de la santé. L'objectif est de créer un médecin IA disponible 24 heures sur 24 et 7 jours sur 7, accessible via un appareil de poche. Cette initiative évalue la capacité de l'IA à fournir des conseils médicaux fiables. HealthBench est un ensemble de données open source qui compare les modèles d'IA à des rubriques rédigées par des médecins. Le modèle de raisonnement o3 d'OpenAI est en tête avec un score de 60 %. Grok suit avec 54 %, et Gemini 2.5 Pro de Google obtient un score de 52 %. La vision d'un médecin IA disponible 24 heures sur 24 et 7 jours sur 7 pourrait révolutionner l'accessibilité aux soins de santé, en particulier dans les zones reculées. Cependant, la nature gourmande en ressources des modèles d'IA pourrait limiter l'accessibilité. Des préoccupations éthiques concernant la confidentialité des données et la désinformation existent également.

Lisez plus d’actualités sur ce sujet :

16 juillet

Riff: Une Innovation Technologique au Service de la Créativité Musicale

16 juillet

AgentCore d'AWS: Une Révolution Technologique pour l'Entreprise Moderne

16 juillet

L'impact social et psychologique des résumés IA de Google sur la consommation d'informations

Avez-vous trouvé une erreur ou une inexactitude ?

Nous étudierons vos commentaires dans les plus brefs délais.