加州大学圣地亚哥分校最近的一项研究表明,OpenAI 的 GPT-4.5 在模仿人类交流方面表现出色,在采用特定人格的三方图灵测试中成功率达到 73%。这表明,在许多情况下,参与者更有可能相信 GPT-4.5 是人类,而不是实际的人类参与者。 这项实验涉及近 300 名参与者,评估了 GPT-4.5 进行基于文本的对话并说服审问者其具有人类性质的能力。当被提示采用人格时,GPT-4.5 的表现明显优于其基线表现,在没有具体指示的情况下,它仅说服了 36% 的参与者。相比之下,OpenAI 的 GPT-4o 在没有人格的情况下成功率为 21%。 图灵测试由艾伦·图灵于 1950 年提出,旨在评估机器表现出与人类相当的智能行为的能力。最近的发现突显了语言模型的进步以及提示工程对人工智能令人信服地模仿人类互动能力的影响。该研究还评估了 Meta 的 Llama 3.1-405B 模型,该模型在人格化提示下的胜率约为 56%。这些结果表明,人工智能系统越来越擅长模仿类似人类的对话,从而引发了关于智能本质以及这些技术潜在的社会和经济影响的重要问题。
GPT-4.5 在加州大学圣地亚哥分校图灵测试中人格化表现成功率达 73%
编辑者: Maria Sagir🐬 Mariamarina0506
阅读更多关于该主题的新闻:
你发现了错误或不准确的地方吗?
我们会尽快考虑您的意见。