GPT-4.5 在加州大學聖地牙哥分校圖靈測試中人格化表現成功率達 73%

编辑者: Maria Sagir🐬 Mariamarina0506

加州大學聖地牙哥分校最近的一項研究表明,OpenAI 的 GPT-4.5 在模仿人類交流方面表現出色,在採用特定人格的三方圖靈測試中成功率達到 73%。這表明,在許多情況下,參與者更有可能相信 GPT-4.5 是人類,而不是實際的人類參與者。 這項實驗涉及近 300 名參與者,評估了 GPT-4.5 進行基於文本的對話並說服審問者其具有人類性質的能力。當被提示採用人格時,GPT-4.5 的表現明顯優於其基準表現,在沒有具體指示的情況下,它僅說服了 36% 的參與者。相比之下,OpenAI 的 GPT-4o 在沒有人格的情況下成功率為 21%。 圖靈測試由艾倫·圖靈於 1950 年提出,旨在評估機器表現出與人類相當的智能行為的能力。最近的發現突顯了語言模型的進步以及提示工程對人工智能令人信服地模仿人類互動能力的影响。該研究還評估了 Meta 的 Llama 3.1-405B 模型,該模型在人格化提示下的勝率約為 56%。這些結果表明,人工智能系統越來越擅長模仿類似人類的對話,從而引發了關於智能本質以及這些技術潛在的社會和經濟影響的重要問題。

发现错误或不准确的地方吗?

我们会尽快处理您的评论。