OpenAI introduceerde HealthBench op 13 mei 2025, een nieuwe dataset voor het evalueren van AI-modellen in de gezondheidszorg. Het doel is om een 24/7 AI-dokter te creëren die toegankelijk is via een apparaat in de zak. Dit initiatief beoordeelt het vermogen van AI om betrouwbaar medisch advies te geven. HealthBench is een open-source dataset die AI-modellen vergelijkt met door artsen geschreven rubrieken. OpenAI's o3 redeneermodel leidt met een score van 60%. Grok volgt met 54%, en Google's Gemini 2.5 Pro scoort 52%. De visie van een 24/7 AI-dokter zou de toegankelijkheid van de gezondheidszorg radicaal kunnen veranderen, vooral in afgelegen gebieden. De resource-intensieve aard van AI-modellen kan echter de toegankelijkheid beperken. Er bestaan ook ethische bezwaren over gegevensprivacy en misinformatie.
OpenAI lanceert HealthBench om AI-modellen in de gezondheidszorg te evalueren
Bewerkt door: Veronika Nazarova
Lees meer nieuws over dit onderwerp:
Heb je een fout of onnauwkeurigheid gevonden?
We zullen je opmerkingen zo snel mogelijk in overweging nemen.