OpenAI Lancia HealthBench per Valutare i Modelli di IA nel Settore Sanitario

Modificato da: Veronika Nazarova

OpenAI ha presentato HealthBench il 13 maggio 2025, un nuovo set di dati per valutare i modelli di IA nel settore sanitario. L'obiettivo è creare un medico IA disponibile 24 ore su 24, 7 giorni su 7, accessibile tramite un dispositivo tascabile. Questa iniziativa valuta la capacità dell'IA di fornire consigli medici affidabili. HealthBench è un set di dati open source che confronta i modelli di IA con le rubriche scritte dai medici. Il modello di ragionamento o3 di OpenAI è in testa con un punteggio del 60%. Grok segue con il 54% e Gemini 2.5 Pro di Google ottiene il 52%. La visione di un medico IA disponibile 24 ore su 24, 7 giorni su 7, potrebbe rivoluzionare l'accessibilità all'assistenza sanitaria, soprattutto nelle aree remote. Tuttavia, la natura ad alta intensità di risorse dei modelli di IA potrebbe limitare l'accessibilità. Esistono anche preoccupazioni etiche sulla privacy dei dati e la disinformazione.

Hai trovato un errore o un'inaccuratezza?

Esamineremo il tuo commento il prima possibile.

GAYA ONE - Unire il mondo con le notizie | Gaya One