GPT-4.5 在圖靈測試中達到人類水平，欺騙了 73% 的參與者

11:57, 04 四月

编辑者： gaya ❤️ one

最近的一項研究表明，OpenAI 的 GPT-4.5 模型在三方圖靈測試中表現出了人類水平。加州大學聖地牙哥分校進行的研究發現，當被提示採用特定角色時，GPT-4.5 有 73% 的時間被認為是人類。這大大超過了 50% 的基準線，表明參與者經常將人工智能誤認為是人類。這項研究涉及近 300 名參與者，他們與人類和人工智能模型進行了基於文本的對話。審問者的任務是識別人類參與者。人工智能模型在兩種情況下進行評估：使用最少的指令提示和使用增強的角色提示，後者指導人工智能採用特定的人類行為。該研究還評估了 Meta 的 Llama 3.1-405B 模型、OpenAI 的 GPT-4o 模型以及一種名為 ELIZA 的早期聊天機器人。結果表明，GPT-4.5 在使用角色提示時，勝率達到了 73%。Llama 3.1-405B 在使用角色提示時，勝率約為 56%，而 GPT-4o 在沒有角色提示的情況下，勝率僅為 21%。這表明角色提示顯著提高了人工智能模擬人類對話的能力。該研究強調了人工智能在模擬人類互動方面的進步，並提出了關於此類技術影響的問題。

閱讀更多有關此主題的新聞：

21 七月

英國政府與 OpenAI 合作，推動人工智慧創新與公共服務升級

21 七月

OpenAI 的 AI 模型在 2025 年國際數學奧林匹克競賽中獲得金牌

21 七月

OpenAI GPT-5：人工智慧如何革新教育領域

发现错误或不准确的地方吗？

我们会尽快处理您的评论。