GPT-4.5 在圖靈測試中達到人類水平,欺騙了 73% 的參與者

编辑者: gaya ❤️ one

最近的一項研究表明,OpenAI 的 GPT-4.5 模型在三方圖靈測試中表現出了人類水平。加州大學聖地牙哥分校進行的研究發現,當被提示採用特定角色時,GPT-4.5 有 73% 的時間被認為是人類。這大大超過了 50% 的基準線,表明參與者經常將人工智能誤認為是人類。 這項研究涉及近 300 名參與者,他們與人類和人工智能模型進行了基於文本的對話。審問者的任務是識別人類參與者。人工智能模型在兩種情況下進行評估:使用最少的指令提示和使用增強的角色提示,後者指導人工智能採用特定的人類行為。該研究還評估了 Meta 的 Llama 3.1-405B 模型、OpenAI 的 GPT-4o 模型以及一種名為 ELIZA 的早期聊天機器人。 結果表明,GPT-4.5 在使用角色提示時,勝率達到了 73%。Llama 3.1-405B 在使用角色提示時,勝率約為 56%,而 GPT-4o 在沒有角色提示的情況下,勝率僅為 21%。這表明角色提示顯著提高了人工智能模擬人類對話的能力。該研究強調了人工智能在模擬人類互動方面的進步,並提出了關於此類技術影響的問題。

发现错误或不准确的地方吗?

我们会尽快处理您的评论。