OpenAI hat am 13. Mai 2025 HealthBench vorgestellt, einen neuen Datensatz zur Bewertung von KI-Modellen im Gesundheitswesen. Ziel ist es, einen rund um die Uhr verfügbaren KI-Arzt zu schaffen, der über ein Taschengerät zugänglich ist. Diese Initiative bewertet die Fähigkeit von KI, zuverlässige medizinische Beratung zu bieten. HealthBench ist ein Open-Source-Datensatz, der KI-Modelle anhand von von Ärzten verfassten Beurteilungskriterien vergleicht. Das o3-Reasoning-Modell von OpenAI führt mit einem Ergebnis von 60 % an. Grok folgt mit 54 % und Googles Gemini 2.5 Pro erzielt 52 %. Die Vision eines rund um die Uhr verfügbaren KI-Arztes könnte die Zugänglichkeit zur Gesundheitsversorgung revolutionieren, insbesondere in abgelegenen Gebieten. Die ressourcenintensive Natur von KI-Modellen könnte die Zugänglichkeit jedoch einschränken. Es bestehen auch ethische Bedenken hinsichtlich des Datenschutzes und der Falschinformation.
OpenAI stellt HealthBench zur Bewertung von KI-Modellen im Gesundheitswesen vor
Bearbeitet von: Veronika Nazarova
Weitere Nachrichten zu diesem Thema lesen:
Haben Sie einen Fehler oder eine Ungenauigkeit festgestellt?
Wir werden Ihre Kommentare so schnell wie möglich berücksichtigen.