OpenAI Luncurkan HealthBench untuk Mengevaluasi Model AI di Bidang Kesehatan

Diedit oleh: Veronika Nazarova

OpenAI memperkenalkan HealthBench pada 13 Mei 2025, sebuah dataset baru untuk mengevaluasi model AI di bidang kesehatan. Tujuannya adalah untuk menciptakan dokter AI 24/7 yang dapat diakses melalui perangkat saku. Inisiatif ini menilai kemampuan AI untuk memberikan saran medis yang andal. HealthBench adalah dataset sumber terbuka yang membandingkan model AI dengan rubrik yang ditulis oleh dokter. Model penalaran o3 OpenAI memimpin dengan skor 60%. Grok mengikuti dengan 54%, dan Gemini 2.5 Pro Google mencetak 52%. Visi dokter AI 24/7 dapat merevolusi aksesibilitas perawatan kesehatan, terutama di daerah terpencil. Namun, sifat model AI yang intensif sumber daya dapat membatasi aksesibilitas. Kekhawatiran etis tentang privasi data dan misinformasi juga ada.

Apakah Anda menemukan kesalahan atau ketidakakuratan?

Kami akan mempertimbangkan komentar Anda sesegera mungkin.

GAYA ONE - Menyatukan Dunia dengan Berita | Gaya One