OpenAI запускає HealthBench для оцінки моделей штучного інтелекту в охороні здоров'я

Відредаговано: Veronika Nazarova

OpenAI представила HealthBench 13 травня 2025 року, новий набір даних для оцінки моделей штучного інтелекту в охороні здоров'я. Мета полягає в створенні цілодобового лікаря зі штучним інтелектом, доступного через кишеньковий пристрій. Ця ініціатива оцінює здатність штучного інтелекту надавати надійні медичні поради. HealthBench — це набір даних з відкритим кодом, який порівнює моделі штучного інтелекту з рубриками, написаними лікарями. Модель міркувань o3 від OpenAI лідирує з результатом 60%. Grok посідає друге місце з 54%, а Gemini 2.5 Pro від Google набирає 52%. Бачення цілодобового лікаря зі штучним інтелектом може революціонізувати доступність охорони здоров'я, особливо у віддалених районах. Однак ресурсомісткий характер моделей штучного інтелекту може обмежити доступність. Існують також етичні занепокоєння щодо конфіденційності даних і дезінформації.

Читайте більше новин на цю тему:

Знайшли помилку чи неточність?

Ми розглянемо ваші коментарі якомога швидше.

GAYA ONE - Об'єднання світу через новини | Gaya One