OpenAI uruchamia HealthBench do oceny modeli AI w opiece zdrowotnej

Edytowane przez: Veronika Nazarova

OpenAI wprowadziło HealthBench 13 maja 2025 roku, nowy zbiór danych do oceny modeli AI w opiece zdrowotnej. Celem jest stworzenie całodobowego lekarza AI dostępnego za pośrednictwem urządzenia kieszonkowego. Inicjatywa ta ocenia zdolność sztucznej inteligencji do udzielania wiarygodnych porad medycznych. HealthBench to zbiór danych o otwartym kodzie źródłowym, który porównuje modele AI z rubrykami napisanymi przez lekarzy. Model rozumowania o3 OpenAI prowadzi z wynikiem 60%. Grok zajmuje drugie miejsce z 54%, a Gemini 2.5 Pro Google uzyskuje 52%. Wizja całodobowego lekarza AI może zrewolucjonizować dostęp do opieki zdrowotnej, szczególnie na obszarach oddalonych. Jednak zasobochłonny charakter modeli AI może ograniczyć dostępność. Istnieją również obawy etyczne dotyczące prywatności danych i dezinformacji.

Czy znalazłeś błąd lub niedokładność?

Rozważymy Twoje uwagi tak szybko, jak to możliwe.

GAYA ONE - Łączenie świata za pomocą wiadomości | Gaya One