GPT-4.5 Osiąga Ludzki Poziom w Teście Turinga, Oszukuje 73% Uczestników

11:57, 04 kwietnia

Edytowane przez: gaya ❤️ one

Ostatnie badania wskazują, że model GPT-4.5 firmy OpenAI wykazał poziom ludzki w trójstronnym teście Turinga. Badanie, przeprowadzone przez Uniwersytet Kalifornijski w San Diego, wykazało, że GPT-4.5 został zidentyfikowany jako człowiek w 73% przypadków, gdy poproszono go o przyjęcie określonej persony. Znacząco przekracza to bazową wartość 50%, co sugeruje, że uczestnicy często mylili sztuczną inteligencję z człowiekiem. Badanie objęło blisko 300 uczestników, którzy prowadzili rozmowy tekstowe zarówno z człowiekiem, jak i modelem AI. Zadaniem przesłuchujących było zidentyfikowanie ludzkiego uczestnika. Modele AI oceniano w dwóch warunkach: z minimalną instrukcją i z rozszerzoną instrukcją persony, która nakierowywała AI na przyjęcie określonego, ludzkiego zachowania. Badanie oceniło również model Llama 3.1-405B firmy Meta, model GPT-4o firmy OpenAI oraz wczesnego chatbota znanego jako ELIZA. Wyniki wskazały, że GPT-4.5, używając instrukcji persony, osiągnął wskaźnik wygranych na poziomie 73%. Llama 3.1-405B z instrukcją persony osiągnęła wskaźnik wygranych na poziomie około 56%, podczas gdy GPT-4o bez instrukcji persony osiągnął wskaźnik wygranych na poziomie zaledwie 21%. Sugeruje to, że instrukcja persony znacząco poprawiła zdolność AI do naśladowania ludzkiej konwersacji. Badanie podkreśla postępy w zdolności AI do symulowania interakcji międzyludzkich i rodzi pytania o implikacje takiej technologii.

Przeczytaj więcej wiadomości na ten temat:

21 lipca

Wielka Brytania i OpenAI współpracują nad rozwojem sztucznej inteligencji w edukacji

21 lipca

OpenAI's Model Achieves Gold Medal Performance at International Mathematical Olympiad 2025

21 lipca

OpenAI wprowadza ChatGPT Edu, rewolucjonizując edukację wyższą

Czy znalazłeś błąd lub niedokładność?

Rozważymy Twoje uwagi tak szybko, jak to możliwe.