OpenAI wprowadziło HealthBench 13 maja 2025 roku, nowy zbiór danych do oceny modeli AI w opiece zdrowotnej. Celem jest stworzenie całodobowego lekarza AI dostępnego za pośrednictwem urządzenia kieszonkowego. Inicjatywa ta ocenia zdolność sztucznej inteligencji do udzielania wiarygodnych porad medycznych. HealthBench to zbiór danych o otwartym kodzie źródłowym, który porównuje modele AI z rubrykami napisanymi przez lekarzy. Model rozumowania o3 OpenAI prowadzi z wynikiem 60%. Grok zajmuje drugie miejsce z 54%, a Gemini 2.5 Pro Google uzyskuje 52%. Wizja całodobowego lekarza AI może zrewolucjonizować dostęp do opieki zdrowotnej, szczególnie na obszarach oddalonych. Jednak zasobochłonny charakter modeli AI może ograniczyć dostępność. Istnieją również obawy etyczne dotyczące prywatności danych i dezinformacji.
OpenAI uruchamia HealthBench do oceny modeli AI w opiece zdrowotnej
Edytowane przez: Veronika Nazarova
Przeczytaj więcej wiadomości na ten temat:
Czy znalazłeś błąd lub niedokładność?
Rozważymy Twoje uwagi tak szybko, jak to możliwe.