瑞士最近一項研究評估了四種AI工具在醫療評估中的表現,結果各異。這項由“On en parle”廣播節目進行的研究,考察了ChatGPT、WhatsApp的Llama4、Google的AI和HUG的ConfIAnce。
這些AI工具接受了與兒科急症、精神健康和糖尿病相關問題的測試。全科醫生根據醫療建議和清晰度評估了AI的回答。
總體而言,ChatGPT和Google的AI表現最強勁,而ConfIAnce得分最低。專家建議在緊急情況下使用AI時要謹慎,理由是存在潛在風險。HUG於2025年2月推出了“confIAnce”,作為瑞士首個由AI驅動的醫療聊天機器人,提供經過驗證的醫療信息。Google也在改進健康搜索中的AI概覽,以提供可信的信息。