5 травня 2026 року OpenAI перевела ChatGPT на модель GPT-5.5 Instant як стандартну для більшості користувачів. Зміни стосуються не лише швидкості генерації, а й способу обробки контексту, що чітко простежується за результатами внутрішніх тестів компанії.
Модель зберігає архітектуру трансформера з використанням суміші експертів (mixture-of-experts), проте частка активних параметрів на токен зросла до 28%. Це дозволило зменшити кількість помилок у завданнях, що потребують довгих ланцюжків міркувань. За даними OpenAI, точність на бенчмарку GPQA зросла з 53% до 61% при тому ж обсязі обчислень на етапі інференсу.
Ключовим нововведенням стала модифікація механізму уваги: тепер модель використовує динамічне зважування контексту залежно від впевненості попередніх токенів. Такий підхід відрізняється від попередньої версії, де ваги розподілялися рівномірно по всьому вікну. У результаті знижується ймовірність галюцинацій під час роботи з фактами, які рідко зустрічаються в навчальній вибірці.
Методологія оцінювання, опублікована в примітках до релізу, охоплює сценарії як zero-shot, так і few-shot. При цьому компанія не надала повних даних про склад тестових наборів, що ускладнює незалежну перевірку. Незалежні дослідники вже відзначають розбіжності між заявленими та відтворюваними показниками на відкритих датасетах.
Порівняно з підходом Anthropic, застосованим у Claude 3.5, OpenAI робить ставку на збільшення активних параметрів, а не на додатковий етап пост-тренування з конституційними принципами. Це створює різні профілі помилок: моделі Anthropic частіше відмовляються відповідати, тоді як GPT-5.5 Instant намагається дати відповідь, але інколи помиляється в деталях.
Для практичного застосування ці зміни означають, що користувачі можуть рідше запитувати повторну генерацію при роботі з технічною документацією або аналізом даних. Однак для завдань, що потребують суворої верифікації фактів, як і раніше, рекомендовано використовувати зовнішні інструменти перевірки.
Залишається відкритим питання, наскільки стійким буде покращення при перенесенні на нові домени. Наступні дослідження, ймовірно, перевірятимуть поведінку моделі на спеціалізованих корпусах, недоступних під час основного навчання.
У підсумку GPT-5.5 Instant демонструє, що точність можна підвищувати не лише завдяки масштабуванню, а й шляхом більш тонкого налаштування механізму уваги.



