GPT-5.5 Instant: как обновлённая архитектура OpenAI уточняет механизм генерации ответов

Отредактировано: Aleksandr Lytviak

5 мая 2026 года OpenAI перевела ChatGPT на модель GPT-5.5 Instant в качестве дефолтной для большинства пользователей. Изменение коснулось не только скорости генерации, но и способа обработки контекста, что заметно по результатам внутренних тестов компании.

Модель сохраняет архитектуру трансформера с mixture-of-experts, однако доля активных параметров на токен выросла до 28 %. Это позволило сократить количество ошибок в задачах с длинными цепочками рассуждений. По данным OpenAI, точность на бенчмарке GPQA увеличилась с 53 % до 61 % при том же объёме вычислений на инференс.

Ключевым нововведением стала модификация механизма внимания: теперь модель использует динамическое взвешивание контекста в зависимости от уверенности предыдущих токенов. Такой подход отличается от предыдущей версии, где веса распределялись равномерно по всему окну. В результате снижается вероятность галлюцинаций при работе с фактами, которые встречаются редко в обучающей выборке.

Методология оценки, опубликованная в релиз-ноутс, включает как zero-shot, так и few-shot сценарии. При этом компания не предоставила полные данные о составе тестовых наборов, что затрудняет независимую проверку. Независимые исследователи уже отмечают расхождения между заявленными и воспроизводимыми показателями на открытых датасетах.

В сравнении с подходом Anthropic, применённым в Claude 3.5, OpenAI делает ставку на увеличение активных параметров, а не на дополнительный этап пост-тренировки с конституционными принципами. Это создаёт разные профили ошибок: модели Anthropic чаще отказываются отвечать, тогда как GPT-5.5 Instant пытается дать ответ, но иногда ошибается в деталях.

Для практического применения изменение означает, что пользователи могут реже запрашивать повторную генерацию при работе с технической документацией или анализом данных. Однако для задач, требующих строгой верификации фактов, по-прежнему рекомендуется использовать внешние инструменты проверки.

Остаётся открытым вопрос, насколько устойчиво улучшение при переносе на новые домены. Следующие исследования, вероятно, будут проверять поведение модели на специализированных корпусах, недоступных во время основного обучения.

В итоге GPT-5.5 Instant демонстрирует, что точность можно повышать не только за счёт масштаба, но и за счёт более тонкой настройки механизма внимания.

6 Просмотров

Источники

  • ChatGPT — Release Notes

Вы нашли ошибку или неточность?Мы учтем ваши комментарии как можно скорее.