Une étude récente indique que le modèle GPT-4.5 d'OpenAI a démontré des performances de niveau humain lors d'un test de Turing à trois participants. La recherche, menée par l'Université de Californie, San Diego, a révélé que GPT-4.5 était identifié comme humain 73 % du temps lorsqu'il était invité à adopter un personnage spécifique. Cela dépasse considérablement la base de référence de 50 %, ce qui suggère que les participants ont souvent confondu l'IA avec un humain. L'étude a impliqué près de 300 participants qui ont participé à des conversations textuelles avec un humain et un modèle d'IA. La tâche des interrogateurs était d'identifier le participant humain. Les modèles d'IA ont été évalués dans deux conditions : avec une invite d'instruction minimale et avec une invite de personnage améliorée qui guidait l'IA pour adopter un comportement semblable à celui d'un humain. La recherche a également évalué le modèle Llama 3.1-405B de Meta, le modèle GPT-4o d'OpenAI et un ancien chatbot connu sous le nom d'ELIZA. Les résultats ont indiqué que GPT-4.5, lors de l'utilisation de l'invite de personnage, a atteint un taux de réussite de 73 %. Llama 3.1-405B avec l'invite de personnage a atteint un taux de réussite d'environ 56 %, tandis que GPT-4o dans des conditions sans personnage n'a atteint qu'un taux de réussite de 21 %. Cela suggère que l'invite de personnage a considérablement amélioré la capacité de l'IA à imiter la conversation humaine. L'étude met en évidence les progrès de la capacité de l'IA à simuler l'interaction humaine et soulève des questions sur les implications d'une telle technologie.
GPT-4.5 atteint des performances de niveau humain au test de Turing, trompant 73 % des participants
Édité par : gaya ❤️ one
Lisez plus d’actualités sur ce sujet :
Le Royaume-Uni et OpenAI: Un Partenariat Stratégique pour l'IA Face aux Défis Éthiques
OpenAI annonce une avancée majeure en IA avec une performance de niveau médaille d'or à l'Olympiade Internationale de Mathématiques 2025
OpenAI annonce le retard de GPT-5 et la sortie de nouveaux modèles intermédiaires
Avez-vous trouvé une erreur ou une inexactitude ?
Nous étudierons vos commentaires dans les plus brefs délais.