OpenAI Lanza HealthBench para Evaluar Modelos de IA en la Atención Médica

Editado por: Veronika Nazarova

OpenAI presentó HealthBench el 13 de mayo de 2025, un nuevo conjunto de datos para evaluar modelos de IA en la atención médica. El objetivo es crear un médico de IA disponible las 24 horas del día, los 7 días de la semana, accesible a través de un dispositivo de bolsillo. Esta iniciativa evalúa la capacidad de la IA para proporcionar consejos médicos fiables. HealthBench es un conjunto de datos de código abierto que compara los modelos de IA con rúbricas escritas por médicos. El modelo de razonamiento o3 de OpenAI lidera con una puntuación del 60%. Grok le sigue con un 54%, y Gemini 2.5 Pro de Google obtiene un 52%. La visión de un médico de IA disponible las 24 horas del día, los 7 días de la semana, podría revolucionar la accesibilidad a la atención médica, especialmente en las zonas remotas. Sin embargo, la naturaleza intensiva en recursos de los modelos de IA puede limitar la accesibilidad. También existen preocupaciones éticas sobre la privacidad de los datos y la desinformación.

¿Encontró un error o inexactitud?

Consideraremos sus comentarios lo antes posible.

GAYA ONE - Uniendo el mundo con noticias | Gaya One