OpenAI lanceert HealthBench om AI-modellen in de gezondheidszorg te evalueren

22:13, 13 mei

Bewerkt door: Veronika Radoslavskaya

OpenAI introduceerde HealthBench op 13 mei 2025, een nieuwe dataset voor het evalueren van AI-modellen in de gezondheidszorg. Het doel is om een 24/7 AI-dokter te creëren die toegankelijk is via een apparaat in de zak. Dit initiatief beoordeelt het vermogen van AI om betrouwbaar medisch advies te geven. HealthBench is een open-source dataset die AI-modellen vergelijkt met door artsen geschreven rubrieken. OpenAI's o3 redeneermodel leidt met een score van 60%. Grok volgt met 54%, en Google's Gemini 2.5 Pro scoort 52%. De visie van een 24/7 AI-dokter zou de toegankelijkheid van de gezondheidszorg radicaal kunnen veranderen, vooral in afgelegen gebieden. De resource-intensieve aard van AI-modellen kan echter de toegankelijkheid beperken. Er bestaan ook ethische bezwaren over gegevensprivacy en misinformatie.

Lees meer nieuws over dit onderwerp:

16 juli

Google's AI-Samenvattingen in Discover: Zorgen voor Uitgevers en de Toekomst van Nieuws

16 juli

De Ethische Implicaties van AI's Ontdekking van SQLite Kwetsbaarheid

16 juli

Verse8 in Sociaal-Psychologische Context: Een Nieuw Platform voor Gamecreatie en de Impact op Gebruikers

Heb je een fout of onnauwkeurigheid gevonden?

We zullen je opmerkingen zo snel mogelijk in overweging nemen.