OpenAI stellt HealthBench zur Bewertung von KI-Modellen im Gesundheitswesen vor

Bearbeitet von: Veronika Nazarova

OpenAI hat am 13. Mai 2025 HealthBench vorgestellt, einen neuen Datensatz zur Bewertung von KI-Modellen im Gesundheitswesen. Ziel ist es, einen rund um die Uhr verfügbaren KI-Arzt zu schaffen, der über ein Taschengerät zugänglich ist. Diese Initiative bewertet die Fähigkeit von KI, zuverlässige medizinische Beratung zu bieten. HealthBench ist ein Open-Source-Datensatz, der KI-Modelle anhand von von Ärzten verfassten Beurteilungskriterien vergleicht. Das o3-Reasoning-Modell von OpenAI führt mit einem Ergebnis von 60 % an. Grok folgt mit 54 % und Googles Gemini 2.5 Pro erzielt 52 %. Die Vision eines rund um die Uhr verfügbaren KI-Arztes könnte die Zugänglichkeit zur Gesundheitsversorgung revolutionieren, insbesondere in abgelegenen Gebieten. Die ressourcenintensive Natur von KI-Modellen könnte die Zugänglichkeit jedoch einschränken. Es bestehen auch ethische Bedenken hinsichtlich des Datenschutzes und der Falschinformation.

Haben Sie einen Fehler oder eine Ungenauigkeit festgestellt?

Wir werden Ihre Kommentare so schnell wie möglich berücksichtigen.