OpenAI Lancia HealthBench per Valutare i Modelli di IA nel Settore Sanitario

22:13, 13 maggio

Modificato da: Veronika Radoslavskaya

OpenAI ha presentato HealthBench il 13 maggio 2025, un nuovo set di dati per valutare i modelli di IA nel settore sanitario. L'obiettivo è creare un medico IA disponibile 24 ore su 24, 7 giorni su 7, accessibile tramite un dispositivo tascabile. Questa iniziativa valuta la capacità dell'IA di fornire consigli medici affidabili. HealthBench è un set di dati open source che confronta i modelli di IA con le rubriche scritte dai medici. Il modello di ragionamento o3 di OpenAI è in testa con un punteggio del 60%. Grok segue con il 54% e Gemini 2.5 Pro di Google ottiene il 52%. La visione di un medico IA disponibile 24 ore su 24, 7 giorni su 7, potrebbe rivoluzionare l'accessibilità all'assistenza sanitaria, soprattutto nelle aree remote. Tuttavia, la natura ad alta intensità di risorse dei modelli di IA potrebbe limitare l'accessibilità. Esistono anche preoccupazioni etiche sulla privacy dei dati e la disinformazione.

Leggi altre notizie su questo argomento:

16 luglio

Riff: L'Editor Musicale AI che Rivoluziona la Produzione Musicale dal Punto di Vista del Marketing

16 luglio

AgentCore di Amazon Bedrock: Una Guida per i Professionisti

16 luglio

Google Discover: Come Funziona e Come Incide sul Traffico Web

Hai trovato un errore o un'inaccuratezza?

Esamineremo il tuo commento il prima possibile.