OpenAI, 13 Mayıs 2025'te sağlık alanındaki yapay zeka modellerini değerlendirmek için yeni bir veri seti olan HealthBench'i tanıttı. Amaç, cep cihazı aracılığıyla erişilebilen, 7/24 hizmet veren bir yapay zeka doktoru oluşturmaktır. Bu girişim, yapay zekanın güvenilir tıbbi tavsiye verme yeteneğini değerlendiriyor. HealthBench, yapay zeka modellerini doktorlar tarafından yazılan derecelendirme ölçeklerine göre karşılaştıran açık kaynaklı bir veri setidir. OpenAI'nin o3 akıl yürütme modeli %60 puanla önde gidiyor. Grok %54 ile onu takip ediyor ve Google'ın Gemini 2.5 Pro'su %52 puan alıyor. 7/24 hizmet veren bir yapay zeka doktoru vizyonu, özellikle uzak bölgelerde sağlık hizmetlerine erişilebilirliği devrimleştirebilir. Ancak, yapay zeka modellerinin kaynak yoğun yapısı erişilebilirliği sınırlayabilir. Veri gizliliği ve yanlış bilgilendirme ile ilgili etik endişeler de bulunmaktadır.
OpenAI, Sağlık Alanındaki Yapay Zeka Modellerini Değerlendirmek İçin HealthBench'i Başlattı
Düzenleyen: Veronika Nazarova
Bu konudaki diğer haberlere göz atın:
Bir hata veya yanlışlık buldunuz mu?
Yorumlarınızı en kısa sürede değerlendireceğiz.