Đánh giá Y tế bằng AI: Nghiên cứu Thụy Sĩ cho thấy kết quả trái chiều vào năm 2025

Edited by: Veronika Nazarova

Một nghiên cứu gần đây của Thụy Sĩ đã đánh giá hiệu suất của bốn công cụ AI trong đánh giá y tế, cho thấy kết quả khác nhau. Nghiên cứu, được thực hiện bởi chương trình phát thanh "On en parle", đã kiểm tra ChatGPT, Llama4 của WhatsApp, AI của Google và ConfIAnce của HUG.

Các công cụ AI đã được kiểm tra bằng các câu hỏi liên quan đến các trường hợp cấp cứu nhi khoa, sức khỏe tâm thần và bệnh tiểu đường. Các bác sĩ đa khoa đánh giá các câu trả lời của AI dựa trên lời khuyên y tế và sự rõ ràng.

Nhìn chung, ChatGPT và AI của Google đã thể hiện hiệu suất mạnh nhất, trong khi ConfIAnce nhận được điểm thấp nhất. Các chuyên gia khuyên nên thận trọng khi sử dụng AI cho các trường hợp khẩn cấp, viện dẫn các rủi ro tiềm ẩn. HUG đã ra mắt 'confIAnce' vào tháng 2 năm 2025 với tư cách là chatbot y tế do AI cung cấp đầu tiên của Thụy Sĩ, cung cấp thông tin y tế đã được xác minh. Google cũng đang cải thiện AI Overviews trong các tìm kiếm về sức khỏe để cung cấp thông tin đáng tin cậy.

Bạn có phát hiện lỗi hoặc sai sót không?

Chúng tôi sẽ xem xét ý kiến của bạn càng sớm càng tốt.