OpenAI uruchamia HealthBench do oceny modeli AI w opiece zdrowotnej

22:13, 13 maja

Edytowane przez: Veronika Radoslavskaya

OpenAI wprowadziło HealthBench 13 maja 2025 roku, nowy zbiór danych do oceny modeli AI w opiece zdrowotnej. Celem jest stworzenie całodobowego lekarza AI dostępnego za pośrednictwem urządzenia kieszonkowego. Inicjatywa ta ocenia zdolność sztucznej inteligencji do udzielania wiarygodnych porad medycznych. HealthBench to zbiór danych o otwartym kodzie źródłowym, który porównuje modele AI z rubrykami napisanymi przez lekarzy. Model rozumowania o3 OpenAI prowadzi z wynikiem 60%. Grok zajmuje drugie miejsce z 54%, a Gemini 2.5 Pro Google uzyskuje 52%. Wizja całodobowego lekarza AI może zrewolucjonizować dostęp do opieki zdrowotnej, szczególnie na obszarach oddalonych. Jednak zasobochłonny charakter modeli AI może ograniczyć dostępność. Istnieją również obawy etyczne dotyczące prywatności danych i dezinformacji.

Przeczytaj więcej wiadomości na ten temat:

16 lipca

Riff: Rewolucja w produkcji muzycznej z perspektywy edukacyjnej - przewodnik dla początkujących

16 lipca

Amazon Bedrock AgentCore: Etyczne aspekty wdrażania agentów AI w przedsiębiorstwach

16 lipca

Google Discover: Analiza wpływu nowych podsumowań AI na rynek treści cyfrowych

Czy znalazłeś błąd lub niedokładność?

Rozważymy Twoje uwagi tak szybko, jak to możliwe.