GPT-4.5 Mencapai Kinerja Setara Manusia dalam Uji Turing, Menipu 73% Peserta

11:57, 04 April

Diedit oleh: gaya ❤️ one

Sebuah studi baru-baru ini menunjukkan bahwa model GPT-4.5 OpenAI telah menunjukkan kinerja setara manusia dalam Uji Turing tiga pihak. Penelitian yang dilakukan oleh University of California, San Diego, menemukan bahwa GPT-4.5 diidentifikasi sebagai manusia 73% dari waktu ketika diminta untuk mengadopsi persona tertentu. Ini secara signifikan melebihi garis dasar 50%, menunjukkan bahwa peserta sering keliru mengira AI sebagai manusia. Studi ini melibatkan hampir 300 peserta yang terlibat dalam percakapan berbasis teks dengan manusia dan model AI. Tugas para interogator adalah mengidentifikasi peserta manusia. Model AI dievaluasi dalam dua kondisi: dengan prompt instruksi minimal dan dengan prompt persona yang ditingkatkan yang memandu AI untuk mengadopsi perilaku seperti manusia tertentu. Penelitian ini juga mengevaluasi model Llama 3.1-405B Meta, model GPT-4o OpenAI, dan chatbot awal yang dikenal sebagai ELIZA. Hasil penelitian menunjukkan bahwa GPT-4.5, ketika menggunakan prompt persona, mencapai tingkat keberhasilan 73%. Llama 3.1-405B dengan prompt persona mencapai tingkat keberhasilan sekitar 56%, sedangkan GPT-4o dalam kondisi tanpa persona hanya mencapai tingkat keberhasilan 21%. Ini menunjukkan bahwa prompt persona secara signifikan meningkatkan kemampuan AI untuk meniru percakapan manusia. Studi ini menyoroti kemajuan dalam kemampuan AI untuk mensimulasikan interaksi manusia dan menimbulkan pertanyaan tentang implikasi dari teknologi tersebut.

Baca lebih banyak berita tentang topik ini:

21 Juli

Kemitraan Inggris Raya dan OpenAI: Mendorong Inovasi AI untuk Layanan Publik yang Lebih Baik

21 Juli

OpenAI's Model Achieves Gold Medal-Level Performance at International Math Olympiad 2025

21 Juli

OpenAI Mengembangkan GPT-5 dengan Fokus pada Integrasi Multimodal dan Peningkatan Penalaran

Apakah Anda menemukan kesalahan atau ketidakakuratan?

Kami akan mempertimbangkan komentar Anda sesegera mungkin.