GPT-4.5 Raggiunge Prestazioni di Livello Umano nel Test di Turing, Ingannando il 73% dei Partecipanti

Modificato da: gaya ❤️ one

Un recente studio indica che il modello GPT-4.5 di OpenAI ha dimostrato prestazioni di livello umano in un test di Turing a tre partecipanti. La ricerca, condotta dall'Università della California, San Diego, ha rilevato che GPT-4.5 è stato identificato come umano il 73% delle volte quando gli è stato chiesto di adottare una specifica persona. Questo supera significativamente la linea di base del 50%, suggerendo che i partecipanti hanno spesso scambiato l'IA per un umano. Lo studio ha coinvolto quasi 300 partecipanti che hanno partecipato a conversazioni testuali con un umano e un modello di IA. Il compito degli interrogatori era identificare il partecipante umano. I modelli di IA sono stati valutati in due condizioni: con un prompt di istruzione minimo e con un prompt di persona migliorato che guidava l'IA ad adottare un comportamento simile a quello umano. La ricerca ha anche valutato il modello Llama 3.1-405B di Meta, il modello GPT-4o di OpenAI e un chatbot iniziale noto come ELIZA. I risultati hanno indicato che GPT-4.5, quando utilizzava il prompt di persona, ha raggiunto un tasso di successo del 73%. Llama 3.1-405B con il prompt di persona ha raggiunto un tasso di successo di circa il 56%, mentre GPT-4o in condizioni senza persona ha raggiunto solo un tasso di successo del 21%. Ciò suggerisce che il prompt di persona ha migliorato significativamente la capacità dell'IA di imitare la conversazione umana. Lo studio evidenzia i progressi nella capacità dell'IA di simulare l'interazione umana e solleva interrogativi sulle implicazioni di tale tecnologia.

Hai trovato un errore o un'inaccuratezza?

Esamineremo il tuo commento il prima possibile.