13 мая 2025 года OpenAI представила HealthBench, новый набор данных для оценки моделей ИИ в здравоохранении. Цель состоит в том, чтобы создать круглосуточного ИИ-врача, доступного через карманное устройство. Эта инициатива оценивает способность ИИ предоставлять надежные медицинские консультации. HealthBench - это набор данных с открытым исходным кодом, который сравнивает модели ИИ с рубриками, написанными врачами. Модель рассуждений o3 от OpenAI лидирует с результатом 60%. Grok следует за ней с 54%, а Gemini 2.5 Pro от Google набирает 52%. Видение круглосуточного ИИ-врача может революционизировать доступность здравоохранения, особенно в отдаленных районах. Однако ресурсоемкий характер моделей ИИ может ограничить доступность. Существуют также этические опасения по поводу конфиденциальности данных и дезинформации.
OpenAI запускает HealthBench для оценки моделей ИИ в здравоохранении
Отредактировано: Veronika Nazarova
Читайте больше новостей по этой теме:
Вы нашли ошибку или неточность?
Мы учтем ваши комментарии как можно скорее.