OpenAI представила HealthBench 13 травня 2025 року, новий набір даних для оцінки моделей штучного інтелекту в охороні здоров'я. Мета полягає в створенні цілодобового лікаря зі штучним інтелектом, доступного через кишеньковий пристрій. Ця ініціатива оцінює здатність штучного інтелекту надавати надійні медичні поради. HealthBench — це набір даних з відкритим кодом, який порівнює моделі штучного інтелекту з рубриками, написаними лікарями. Модель міркувань o3 від OpenAI лідирує з результатом 60%. Grok посідає друге місце з 54%, а Gemini 2.5 Pro від Google набирає 52%. Бачення цілодобового лікаря зі штучним інтелектом може революціонізувати доступність охорони здоров'я, особливо у віддалених районах. Однак ресурсомісткий характер моделей штучного інтелекту може обмежити доступність. Існують також етичні занепокоєння щодо конфіденційності даних і дезінформації.
OpenAI запускає HealthBench для оцінки моделей штучного інтелекту в охороні здоров'я
Відредаговано: Veronika Nazarova
Читайте більше новин на цю тему:
Знайшли помилку чи неточність?
Ми розглянемо ваші коментарі якомога швидше.