OpenAI Luncurkan HealthBench untuk Mengevaluasi Model AI di Bidang Kesehatan

22:13, 13 Mei

Diedit oleh: Veronika Radoslavskaya

OpenAI memperkenalkan HealthBench pada 13 Mei 2025, sebuah dataset baru untuk mengevaluasi model AI di bidang kesehatan. Tujuannya adalah untuk menciptakan dokter AI 24/7 yang dapat diakses melalui perangkat saku. Inisiatif ini menilai kemampuan AI untuk memberikan saran medis yang andal. HealthBench adalah dataset sumber terbuka yang membandingkan model AI dengan rubrik yang ditulis oleh dokter. Model penalaran o3 OpenAI memimpin dengan skor 60%. Grok mengikuti dengan 54%, dan Gemini 2.5 Pro Google mencetak 52%. Visi dokter AI 24/7 dapat merevolusi aksesibilitas perawatan kesehatan, terutama di daerah terpencil. Namun, sifat model AI yang intensif sumber daya dapat membatasi aksesibilitas. Kekhawatiran etis tentang privasi data dan misinformasi juga ada.

Baca lebih banyak berita tentang topik ini:

16 Juli

Riff: Editor Musik Bertenaga AI yang Siap Mengubah Industri Musik

16 Juli

Amazon Bedrock AgentCore: Terobosan Teknologi untuk Pengembangan Agen AI

16 Juli

Dampak AI-Generated Summaries Google Discover: Perspektif Bisnis

Apakah Anda menemukan kesalahan atau ketidakakuratan?

Kami akan mempertimbangkan komentar Anda sesegera mungkin.