OpenAI Lanza HealthBench para Evaluar Modelos de IA en la Atención Médica

22:13, 13 mayo

Editado por: Veronika Radoslavskaya

OpenAI presentó HealthBench el 13 de mayo de 2025, un nuevo conjunto de datos para evaluar modelos de IA en la atención médica. El objetivo es crear un médico de IA disponible las 24 horas del día, los 7 días de la semana, accesible a través de un dispositivo de bolsillo. Esta iniciativa evalúa la capacidad de la IA para proporcionar consejos médicos fiables. HealthBench es un conjunto de datos de código abierto que compara los modelos de IA con rúbricas escritas por médicos. El modelo de razonamiento o3 de OpenAI lidera con una puntuación del 60%. Grok le sigue con un 54%, y Gemini 2.5 Pro de Google obtiene un 52%. La visión de un médico de IA disponible las 24 horas del día, los 7 días de la semana, podría revolucionar la accesibilidad a la atención médica, especialmente en las zonas remotas. Sin embargo, la naturaleza intensiva en recursos de los modelos de IA puede limitar la accesibilidad. También existen preocupaciones éticas sobre la privacidad de los datos y la desinformación.

Lea más noticias sobre este tema:

16 julio

El Futuro de los Resúmenes con IA en Google Discover: Un Análisis Predictivo

16 julio

La Inteligencia Artificial y la Ciberseguridad: Un Análisis Profundo del Panorama Actual

16 julio

Verse8: Una Mirada al Futuro de la Creación de Juegos con IA

¿Encontró un error o inexactitud?

Consideraremos sus comentarios lo antes posible.