Нещодавнє дослідження показує, що модель GPT-4.5 від OpenAI продемонструвала людський рівень продуктивності в тристоронньому тесті Тюрінга. Дослідження, проведене Каліфорнійським університетом у Сан-Дієго, виявило, що GPT-4.5 було ідентифіковано як людину у 73% випадків, коли її просили прийняти певну персону. Це значно перевищує базовий показник у 50%, що свідчить про те, що учасники часто помилково приймали штучний інтелект за людину. У дослідженні взяли участь майже 300 учасників, які брали участь у текстових розмовах як з людиною, так і з моделлю штучного інтелекту. Завданням слідчих було ідентифікувати людського учасника. Моделі штучного інтелекту оцінювалися за двох умов: з мінімальним запитом інструкцій і з розширеним запитом персони, який спрямовував штучний інтелект на прийняття певної людської поведінки. Дослідження також оцінило модель Llama 3.1-405B від Meta, модель GPT-4o від OpenAI та раннього чат-бота під назвою ELIZA. Результати показали, що GPT-4.5, використовуючи запит персони, досягла показника виграшу 73%. Llama 3.1-405B із запитом персони досягла показника виграшу близько 56%, тоді як GPT-4o без умов персони досягла лише показника виграшу 21%. Це свідчить про те, що запит персони значно покращив здатність штучного інтелекту імітувати людську розмову. Дослідження підкреслює прогрес у здатності штучного інтелекту імітувати людську взаємодію та порушує питання про наслідки такої технології.
GPT-4.5 Досягає Людського Рівня в Тесті Тюрінга, Обманює 73% Учасників
Відредаговано: gaya ❤️ one
Читайте більше новин на цю тему:
Знайшли помилку чи неточність?
Ми розглянемо ваші коментарі якомога швидше.