Ostatnie badania wskazują, że model GPT-4.5 firmy OpenAI wykazał poziom ludzki w trójstronnym teście Turinga. Badanie, przeprowadzone przez Uniwersytet Kalifornijski w San Diego, wykazało, że GPT-4.5 został zidentyfikowany jako człowiek w 73% przypadków, gdy poproszono go o przyjęcie określonej persony. Znacząco przekracza to bazową wartość 50%, co sugeruje, że uczestnicy często mylili sztuczną inteligencję z człowiekiem. Badanie objęło blisko 300 uczestników, którzy prowadzili rozmowy tekstowe zarówno z człowiekiem, jak i modelem AI. Zadaniem przesłuchujących było zidentyfikowanie ludzkiego uczestnika. Modele AI oceniano w dwóch warunkach: z minimalną instrukcją i z rozszerzoną instrukcją persony, która nakierowywała AI na przyjęcie określonego, ludzkiego zachowania. Badanie oceniło również model Llama 3.1-405B firmy Meta, model GPT-4o firmy OpenAI oraz wczesnego chatbota znanego jako ELIZA. Wyniki wskazały, że GPT-4.5, używając instrukcji persony, osiągnął wskaźnik wygranych na poziomie 73%. Llama 3.1-405B z instrukcją persony osiągnęła wskaźnik wygranych na poziomie około 56%, podczas gdy GPT-4o bez instrukcji persony osiągnął wskaźnik wygranych na poziomie zaledwie 21%. Sugeruje to, że instrukcja persony znacząco poprawiła zdolność AI do naśladowania ludzkiej konwersacji. Badanie podkreśla postępy w zdolności AI do symulowania interakcji międzyludzkich i rodzi pytania o implikacje takiej technologii.
GPT-4.5 Osiąga Ludzki Poziom w Teście Turinga, Oszukuje 73% Uczestników
Edytowane przez: gaya ❤️ one
Przeczytaj więcej wiadomości na ten temat:
Czy znalazłeś błąd lub niedokładność?
Rozważymy Twoje uwagi tak szybko, jak to możliwe.