OpenAI lanceert HealthBench om AI-modellen in de gezondheidszorg te evalueren

Bewerkt door: Veronika Nazarova

OpenAI introduceerde HealthBench op 13 mei 2025, een nieuwe dataset voor het evalueren van AI-modellen in de gezondheidszorg. Het doel is om een 24/7 AI-dokter te creëren die toegankelijk is via een apparaat in de zak. Dit initiatief beoordeelt het vermogen van AI om betrouwbaar medisch advies te geven. HealthBench is een open-source dataset die AI-modellen vergelijkt met door artsen geschreven rubrieken. OpenAI's o3 redeneermodel leidt met een score van 60%. Grok volgt met 54%, en Google's Gemini 2.5 Pro scoort 52%. De visie van een 24/7 AI-dokter zou de toegankelijkheid van de gezondheidszorg radicaal kunnen veranderen, vooral in afgelegen gebieden. De resource-intensieve aard van AI-modellen kan echter de toegankelijkheid beperken. Er bestaan ook ethische bezwaren over gegevensprivacy en misinformatie.

Heb je een fout of onnauwkeurigheid gevonden?

We zullen je opmerkingen zo snel mogelijk in overweging nemen.