Evaluasi Medis AI: Studi Swiss Menunjukkan Hasil Campuran pada Tahun 2025

16:04, 09 Mei

Edited by: Veronika Nazarova

Sebuah studi Swiss baru-baru ini menilai kinerja empat alat AI dalam evaluasi medis, mengungkapkan hasil yang bervariasi. Studi tersebut, yang dilakukan oleh acara radio "On en parle", menguji ChatGPT, Llama4 WhatsApp, AI Google, dan ConfIAnce HUG.

Alat AI diuji menggunakan pertanyaan yang berkaitan dengan keadaan darurat pediatrik, kesehatan mental, dan diabetes. Dokter umum mengevaluasi respons AI berdasarkan saran medis dan kejelasan.

Secara keseluruhan, ChatGPT dan AI Google menunjukkan kinerja terkuat, sementara ConfIAnce menerima skor terendah. Para ahli menyarankan kehati-hatian saat menggunakan AI untuk keadaan darurat, dengan alasan potensi risiko. HUG meluncurkan 'confIAnce' pada Februari 2025 sebagai chatbot medis bertenaga AI pertama di Swiss yang menyediakan informasi medis terverifikasi. Google juga meningkatkan Ikhtisar AI dalam pencarian kesehatan untuk menawarkan informasi yang kredibel.

Apakah Anda menemukan kesalahan atau ketidakakuratan?

Kami akan mempertimbangkan komentar Anda sesegera mungkin.