GPT-4.5、UCサンディエゴでのペルソナを用いたチューリングテストで73%の成功率を達成

編集者: Maria Sagir🐬 Mariamarina0506

カリフォルニア大学サンディエゴ校で行われた最近の研究で、OpenAIのGPT-4.5は、特定のペルソナを採用した場合、3者間チューリングテストで73%の成功率を達成し、人間のコミュニケーションを模倣する驚くべき能力を示しました。これは、多くの場合、参加者が実際の人間参加者よりもGPT-4.5を人間であると信じる可能性が高いことを示唆しています。 約300人の参加者が参加した実験では、GPT-4.5がテキストベースの会話を行い、尋問者をその人間のような性質について納得させる能力を評価しました。ペルソナを採用するように求められた場合、GPT-4.5は、特定の指示なしに36%の参加者しか納得させられなかったベースラインのパフォーマンスを大幅に上回りました。比較すると、OpenAIのGPT-4oは、ペルソナなしで21%の成功率を達成しました。 1950年にアラン・チューリングによって概念化されたチューリングテストは、機械が人間と同等の知的行動を示す能力を評価します。最近の調査結果は、言語モデルの進歩と、AIが人間の相互作用を説得力を持って模倣する能力に対するプロンプトエンジニアリングの影響を強調しています。この研究では、MetaのLlama 3.1-405Bモデルも評価され、ペルソナプロンプトで約56%の勝率を達成しました。これらの結果は、AIシステムが人間のような会話を模倣する能力がますます向上していることを示しており、知性の本質とこれらの技術の潜在的な社会的および経済的影響について重要な疑問を提起しています。

エラーや不正確な情報を見つけましたか?

できるだけ早くコメントを考慮します。