Um estudo recente indica que o modelo GPT-4.5 da OpenAI demonstrou desempenho de nível humano em um Teste de Turing de três participantes. A pesquisa, conduzida pela Universidade da Califórnia, San Diego, descobriu que o GPT-4.5 foi identificado como humano 73% das vezes quando solicitado a adotar uma persona específica. Isso excede significativamente a linha de base de 50%, sugerindo que os participantes frequentemente confundiram a IA com um humano. O estudo envolveu quase 300 participantes que se envolveram em conversas baseadas em texto com um humano e um modelo de IA. A tarefa dos interrogadores era identificar o participante humano. Os modelos de IA foram avaliados sob duas condições: com um prompt de instrução mínimo e com um prompt de persona aprimorado que orientava a IA a adotar um comportamento semelhante ao humano. A pesquisa também avaliou o modelo Llama 3.1-405B da Meta, o modelo GPT-4o da OpenAI e um chatbot inicial conhecido como ELIZA. Os resultados indicaram que o GPT-4.5, ao usar o prompt de persona, alcançou uma taxa de sucesso de 73%. O Llama 3.1-405B com o prompt de persona atingiu uma taxa de sucesso de cerca de 56%, enquanto o GPT-4o em condições sem persona atingiu apenas uma taxa de sucesso de 21%. Isso sugere que o prompt de persona melhorou significativamente a capacidade da IA de imitar a conversa humana. O estudo destaca os avanços na capacidade da IA de simular a interação humana e levanta questões sobre as implicações de tal tecnologia.
GPT-4.5 Atinge Desempenho de Nível Humano no Teste de Turing, Enganando 73% dos Participantes
Editado por: gaya ❤️ one
Leia mais notícias sobre este tema:
Encontrou um erro ou imprecisão?
Vamos considerar seus comentários assim que possível.