OpenAI stellt HealthBench zur Bewertung von KI-Modellen im Gesundheitswesen vor

22:13, 13 Mai

Bearbeitet von: Veronika Radoslavskaya

OpenAI hat am 13. Mai 2025 HealthBench vorgestellt, einen neuen Datensatz zur Bewertung von KI-Modellen im Gesundheitswesen. Ziel ist es, einen rund um die Uhr verfügbaren KI-Arzt zu schaffen, der über ein Taschengerät zugänglich ist. Diese Initiative bewertet die Fähigkeit von KI, zuverlässige medizinische Beratung zu bieten. HealthBench ist ein Open-Source-Datensatz, der KI-Modelle anhand von von Ärzten verfassten Beurteilungskriterien vergleicht. Das o3-Reasoning-Modell von OpenAI führt mit einem Ergebnis von 60 % an. Grok folgt mit 54 % und Googles Gemini 2.5 Pro erzielt 52 %. Die Vision eines rund um die Uhr verfügbaren KI-Arztes könnte die Zugänglichkeit zur Gesundheitsversorgung revolutionieren, insbesondere in abgelegenen Gebieten. Die ressourcenintensive Natur von KI-Modellen könnte die Zugänglichkeit jedoch einschränken. Es bestehen auch ethische Bedenken hinsichtlich des Datenschutzes und der Falschinformation.

Weitere Nachrichten zu diesem Thema lesen:

16 Juli

Riff: Ein Durchbruch für die Musikproduktion im Geschäftsumfeld

16 Juli

Amazon Bedrock AgentCore: Ein Durchbruch für die Wirtschaft durch KI-Agenten

16 Juli

Google's KI-Zusammenfassungen in Discover: Eine technologische Herausforderung für Verlage

Haben Sie einen Fehler oder eine Ungenauigkeit festgestellt?

Wir werden Ihre Kommentare so schnell wie möglich berücksichtigen.