GPT-4.5 Достигает 73% Успеха в Тесте Тьюринга с Персоной в Калифорнийском университете в Сан-Диего

Отредактировано: Maria Sagir🐬 Mariamarina0506

В недавнем исследовании, проведенном в Калифорнийском университете в Сан-Диего, GPT-4.5 от OpenAI продемонстрировал замечательную способность имитировать человеческое общение, достигнув 73% успеха в трехстороннем тесте Тьюринга при принятии определенной персоны. Это говорит о том, что во многих случаях участники с большей вероятностью верили, что GPT-4.5 является человеком, по сравнению с реальным участником-человеком. Эксперимент, в котором приняли участие около 300 человек, оценивал способность GPT-4.5 участвовать в текстовых беседах и убеждать допрашивающих в своей человеческой природе. При запросе на принятие персоны GPT-4.5 значительно превзошел свои базовые показатели, где он убедил только 36% участников без конкретных инструкций. Для сравнения, GPT-4o от OpenAI достиг 21% успеха без персоны. Тест Тьюринга, разработанный Аланом Тьюрингом в 1950 году, оценивает способность машины демонстрировать интеллектуальное поведение, эквивалентное человеческому. Недавние результаты подчеркивают достижения в языковых моделях и влияние разработки подсказок на способность ИИ убедительно имитировать человеческое взаимодействие. В исследовании также оценивалась модель Llama 3.1-405B от Meta, которая достигла показателя побед около 56% с подсказкой персоны. Эти результаты указывают на то, что системы ИИ становятся все более умелыми в имитации человеческого разговора, поднимая важные вопросы о природе интеллекта и потенциальных социальных и экономических последствиях этих технологий.

Вы нашли ошибку или неточность?

Мы учтем ваши комментарии как можно скорее.