GPT-4.5 osiąga 73% skuteczności w teście Turinga z personą na UC San Diego

09:12, 04 kwietnia

Edytowane przez: Maria Sagir🐬 Mariamarina0506

W niedawnym badaniu przeprowadzonym na Uniwersytecie Kalifornijskim w San Diego, GPT-4.5 od OpenAI zademonstrował niezwykłą zdolność do naśladowania ludzkiej komunikacji, osiągając 73% skuteczności w trójstronnym teście Turinga, przyjmując określoną personę. Sugeruje to, że w wielu przypadkach uczestnicy byli bardziej skłonni uwierzyć, że GPT-4.5 jest człowiekiem, w porównaniu z rzeczywistym uczestnikiem-człowiekiem. Eksperyment, w którym wzięło udział blisko 300 uczestników, oceniał zdolność GPT-4.5 do angażowania się w rozmowy tekstowe i przekonywania przesłuchujących o jego ludzkiej naturze. Po otrzymaniu polecenia przyjęcia persony, GPT-4.5 znacznie przewyższył swoją bazową wydajność, gdzie przekonał tylko 36% uczestników bez konkretnych instrukcji. Dla porównania, GPT-4o od OpenAI osiągnął 21% skuteczności bez persony. Test Turinga, opracowany przez Alana Turinga w 1950 roku, ocenia zdolność maszyny do wykazywania inteligentnego zachowania równoważnego zachowaniu człowieka. Najnowsze odkrycia podkreślają postępy w modelach językowych i wpływ inżynierii promptów na zdolność sztucznej inteligencji do przekonującego naśladowania interakcji międzyludzkich. W badaniu oceniono również model Llama 3.1-405B firmy Meta, który osiągnął wskaźnik wygranych na poziomie około 56% z promptem persony. Wyniki te wskazują, że systemy AI stają się coraz bardziej biegłe w naśladowaniu rozmów przypominających ludzkie, co rodzi ważne pytania o naturę inteligencji oraz potencjalne społeczne i ekonomiczne skutki tych technologii.

Przeczytaj więcej wiadomości na ten temat:

18 maja

Brain Plasticity: How Your Brain Adapts to Learn New Skills in 2025

18 maja

Unlock Calm: Breathing Techniques for Anger Management in 2025

18 maja

Neuroscience in 2025: How Silence Rewires Your Brain for Enhanced Clarity and Memory

Czy znalazłeś błąd lub niedokładność?

Rozważymy Twoje uwagi tak szybko, jak to możliwe.