OpenAI Lança HealthBench para Avaliar Modelos de IA na Área da Saúde

Editado por: Veronika Nazarova

A OpenAI apresentou o HealthBench em 13 de maio de 2025, um novo conjunto de dados para avaliar modelos de IA na área da saúde. O objetivo é criar um médico de IA disponível 24 horas por dia, 7 dias por semana, acessível através de um dispositivo de bolso. Esta iniciativa avalia a capacidade da IA de fornecer aconselhamento médico confiável. O HealthBench é um conjunto de dados de código aberto que compara modelos de IA com rubricas escritas por médicos. O modelo de raciocínio o3 da OpenAI lidera com uma pontuação de 60%. O Grok segue com 54%, e o Gemini 2.5 Pro do Google obtém 52%. A visão de um médico de IA disponível 24 horas por dia, 7 dias por semana, pode revolucionar a acessibilidade aos cuidados de saúde, especialmente em áreas remotas. No entanto, a natureza intensiva em recursos dos modelos de IA pode limitar a acessibilidade. Também existem preocupações éticas sobre a privacidade dos dados e a desinformação.

Encontrou um erro ou imprecisão?

Vamos considerar seus comentários assim que possível.

GAYA ONE - Unindo o mundo com notícias | Gaya One