OpenAI, Sağlık Alanındaki Yapay Zeka Modellerini Değerlendirmek İçin HealthBench'i Başlattı

22:13, 13 Mayıs

Düzenleyen: Veronika Radoslavskaya

OpenAI, 13 Mayıs 2025'te sağlık alanındaki yapay zeka modellerini değerlendirmek için yeni bir veri seti olan HealthBench'i tanıttı. Amaç, cep cihazı aracılığıyla erişilebilen, 7/24 hizmet veren bir yapay zeka doktoru oluşturmaktır. Bu girişim, yapay zekanın güvenilir tıbbi tavsiye verme yeteneğini değerlendiriyor. HealthBench, yapay zeka modellerini doktorlar tarafından yazılan derecelendirme ölçeklerine göre karşılaştıran açık kaynaklı bir veri setidir. OpenAI'nin o3 akıl yürütme modeli %60 puanla önde gidiyor. Grok %54 ile onu takip ediyor ve Google'ın Gemini 2.5 Pro'su %52 puan alıyor. 7/24 hizmet veren bir yapay zeka doktoru vizyonu, özellikle uzak bölgelerde sağlık hizmetlerine erişilebilirliği devrimleştirebilir. Ancak, yapay zeka modellerinin kaynak yoğun yapısı erişilebilirliği sınırlayabilir. Veri gizliliği ve yanlış bilgilendirme ile ilgili etik endişeler de bulunmaktadır.

Bu konudaki diğer haberlere göz atın:

16 Temmuz

Riff'in Müzik Dünyasına Etkisi: Teknolojik Bir Devrim mi?

16 Temmuz

Amazon Bedrock AgentCore'un Geleceği: Teknolojik Bir İnceleme

16 Temmuz

Google'ın Yapay Zeka Özetleri: Türk Kullanıcıların Tepkileri ve Sosyal Etkileri

Bir hata veya yanlışlık buldunuz mu?

Yorumlarınızı en kısa sürede değerlendireceğiz.