У нещодавньому дослідженні в Каліфорнійському університеті в Сан-Дієго GPT-4.5 від OpenAI продемонстрував чудову здатність імітувати людське спілкування, досягнувши 73% успішності в тристоронньому тесті Тюрінга при використанні певної персони. Це свідчить про те, що в багатьох випадках учасники були більш схильні вважати, що GPT-4.5 є людиною, порівняно з фактичним учасником-людиною. Експеримент, в якому взяли участь майже 300 учасників, оцінював здатність GPT-4.5 брати участь у текстових розмовах і переконувати слідчих у своїй людиноподібній природі. Коли GPT-4.5 було запропоновано прийняти персону, він значно перевершив свою базову продуктивність, де він переконав лише 36% учасників без конкретних інструкцій. Для порівняння, GPT-4o від OpenAI досяг 21% успішності без персони. Тест Тюрінга, розроблений Аланом Тюрінгом у 1950 році, оцінює здатність машини демонструвати інтелектуальну поведінку, еквівалентну людській. Останні результати підкреслюють прогрес у мовних моделях і вплив інженерії підказок на здатність штучного інтелекту переконливо імітувати людську взаємодію. Дослідження також оцінило модель Llama 3.1-405B від Meta, яка досягла приблизно 56% виграшів із підказкою персони. Ці результати показують, що системи штучного інтелекту стають дедалі більш вправними в імітації людиноподібних розмов, що порушує важливі питання про природу інтелекту та потенційні соціальні та економічні наслідки цих технологій.
GPT-4.5 досягає 73% успішності в тесті Тюрінга з персоною в Каліфорнійському університеті в Сан-Дієго
Відредаговано: Maria Sagir🐬 Mariamarina0506
Читайте більше новин на цю тему:
Знайшли помилку чи неточність?
Ми розглянемо ваші коментарі якомога швидше.