Une récente étude suisse a évalué la performance de quatre outils d'IA dans les évaluations médicales, révélant des résultats variés. L'étude, menée par l'émission de radio "On en parle", a examiné ChatGPT, Llama4 de WhatsApp, l'IA de Google et ConfIAnce de HUG.
Les outils d'IA ont été testés à l'aide de questions relatives aux urgences pédiatriques, à la santé mentale et au diabète. Des médecins généralistes ont évalué les réponses de l'IA en fonction des conseils médicaux et de la clarté.
Dans l'ensemble, ChatGPT et l'IA de Google ont démontré les performances les plus solides, tandis que ConfIAnce a reçu les scores les plus bas. Les experts conseillent la prudence lors de l'utilisation de l'IA pour les urgences, citant des risques potentiels. HUG a lancé 'confIAnce' en février 2025 en tant que premier chatbot médical suisse alimenté par l'IA, fournissant des informations médicales vérifiées. Google améliore également les aperçus de l'IA dans les recherches sur la santé afin d'offrir des informations crédibles.