GPT-4.5 在图灵测试中达到人类水平，欺骗了 73% 的参与者

11:57, 04 四月

编辑者： gaya ❤️ one

最近的一项研究表明，OpenAI 的 GPT-4.5 模型在三方图灵测试中表现出了人类水平。加州大学圣地亚哥分校进行的研究发现，当被提示采用特定角色时，GPT-4.5 有 73% 的时间被认为是人类。这大大超过了 50% 的基线，表明参与者经常将人工智能误认为是人类。这项研究涉及近 300 名参与者，他们与人类和人工智能模型进行了基于文本的对话。审问者的任务是识别人类参与者。人工智能模型在两种情况下进行评估：使用最少的指令提示和使用增强的角色提示，后者指导人工智能采用特定的人类行为。该研究还评估了 Meta 的 Llama 3.1-405B 模型、OpenAI 的 GPT-4o 模型以及一种名为 ELIZA 的早期聊天机器人。结果表明，GPT-4.5 在使用角色提示时，胜率达到了 73%。Llama 3.1-405B 在使用角色提示时，胜率约为 56%，而 GPT-4o 在没有角色提示的情况下，胜率仅为 21%。这表明角色提示显着提高了人工智能模拟人类对话的能力。该研究强调了人工智能在模拟人类互动方面的进步，并提出了关于此类技术影响的问题。

通知中心

GPT-4.5 在图灵测试中达到人类水平，欺骗了 73% 的参与者

阅读更多关于该主题的新闻：