GPT-4.5 Досягає Людського Рівня в Тесті Тюрінга, Обманює 73% Учасників

11:57, 04 квітня

Відредаговано: gaya ❤️ one

Нещодавнє дослідження показує, що модель GPT-4.5 від OpenAI продемонструвала людський рівень продуктивності в тристоронньому тесті Тюрінга. Дослідження, проведене Каліфорнійським університетом у Сан-Дієго, виявило, що GPT-4.5 було ідентифіковано як людину у 73% випадків, коли її просили прийняти певну персону. Це значно перевищує базовий показник у 50%, що свідчить про те, що учасники часто помилково приймали штучний інтелект за людину. У дослідженні взяли участь майже 300 учасників, які брали участь у текстових розмовах як з людиною, так і з моделлю штучного інтелекту. Завданням слідчих було ідентифікувати людського учасника. Моделі штучного інтелекту оцінювалися за двох умов: з мінімальним запитом інструкцій і з розширеним запитом персони, який спрямовував штучний інтелект на прийняття певної людської поведінки. Дослідження також оцінило модель Llama 3.1-405B від Meta, модель GPT-4o від OpenAI та раннього чат-бота під назвою ELIZA. Результати показали, що GPT-4.5, використовуючи запит персони, досягла показника виграшу 73%. Llama 3.1-405B із запитом персони досягла показника виграшу близько 56%, тоді як GPT-4o без умов персони досягла лише показника виграшу 21%. Це свідчить про те, що запит персони значно покращив здатність штучного інтелекту імітувати людську розмову. Дослідження підкреслює прогрес у здатності штучного інтелекту імітувати людську взаємодію та порушує питання про наслідки такої технології.

Читайте більше новин на цю тему:

21 липня

Великобританія та OpenAI: етичні аспекти партнерства у розвитку штучного інтелекту

21 липня

OpenAI's AI Model Achieves Gold Medal-Level Performance at International Mathematical Olympiad 2025

21 липня

OpenAI оголошує про затримку запуску GPT-5 та випуск нових моделей o3 та o4-mini

Знайшли помилку чи неточність?

Ми розглянемо ваші коментарі якомога швидше.