最近的一项研究表明,OpenAI 的 GPT-4.5 模型在三方图灵测试中表现出了人类水平。加州大学圣地亚哥分校进行的研究发现,当被提示采用特定角色时,GPT-4.5 有 73% 的时间被认为是人类。这大大超过了 50% 的基线,表明参与者经常将人工智能误认为是人类。 这项研究涉及近 300 名参与者,他们与人类和人工智能模型进行了基于文本的对话。审问者的任务是识别人类参与者。人工智能模型在两种情况下进行评估:使用最少的指令提示和使用增强的角色提示,后者指导人工智能采用特定的人类行为。该研究还评估了 Meta 的 Llama 3.1-405B 模型、OpenAI 的 GPT-4o 模型以及一种名为 ELIZA 的早期聊天机器人。 结果表明,GPT-4.5 在使用角色提示时,胜率达到了 73%。Llama 3.1-405B 在使用角色提示时,胜率约为 56%,而 GPT-4o 在没有角色提示的情况下,胜率仅为 21%。这表明角色提示显着提高了人工智能模拟人类对话的能力。该研究强调了人工智能在模拟人类互动方面的进步,并提出了关于此类技术影响的问题。
GPT-4.5 在图灵测试中达到人类水平,欺骗了 73% 的参与者
编辑者: gaya ❤️ one
阅读更多关于该主题的新闻:
你发现了错误或不准确的地方吗?
我们会尽快考虑您的意见。