OpenAI, Sağlık Alanındaki Yapay Zeka Modellerini Değerlendirmek İçin HealthBench'i Başlattı

Düzenleyen: Veronika Nazarova

OpenAI, 13 Mayıs 2025'te sağlık alanındaki yapay zeka modellerini değerlendirmek için yeni bir veri seti olan HealthBench'i tanıttı. Amaç, cep cihazı aracılığıyla erişilebilen, 7/24 hizmet veren bir yapay zeka doktoru oluşturmaktır. Bu girişim, yapay zekanın güvenilir tıbbi tavsiye verme yeteneğini değerlendiriyor. HealthBench, yapay zeka modellerini doktorlar tarafından yazılan derecelendirme ölçeklerine göre karşılaştıran açık kaynaklı bir veri setidir. OpenAI'nin o3 akıl yürütme modeli %60 puanla önde gidiyor. Grok %54 ile onu takip ediyor ve Google'ın Gemini 2.5 Pro'su %52 puan alıyor. 7/24 hizmet veren bir yapay zeka doktoru vizyonu, özellikle uzak bölgelerde sağlık hizmetlerine erişilebilirliği devrimleştirebilir. Ancak, yapay zeka modellerinin kaynak yoğun yapısı erişilebilirliği sınırlayabilir. Veri gizliliği ve yanlış bilgilendirme ile ilgili etik endişeler de bulunmaktadır.

Bir hata veya yanlışlık buldunuz mu?

Yorumlarınızı en kısa sürede değerlendireceğiz.

GAYA ONE - Dünyayı Haberlerle Birleştirmek | Gaya One