22 червня 2026 року токійська лабораторія Sakana AI відкрила загальний доступ до Fugu та її старшої версії Fugu Ultra. Це не чергова велика мовна модель, а справжній оркестратор: навчена модель, що приймає запит на єдиний OpenAI-сумісний ендпоінт, а далі самостійно вирішує — впоратися самотужки чи зібрати команду зі сторонніх флагманських моделей (GPT-5.5, Claude, Gemini тощо, аж до рекурсивного виклику самої себе). Розподіл ролей, перевірка проміжних результатів та формування фінальної відповіді відбуваються всередині системи, не зачіпаючи код користувача.
Ідея з’явилася не на порожньому місці. Перша половина 2026 року продемонструвала крихкість ставки на одного постачальника: 12 червня компанія Anthropic під дією американського експортного припису закрила публічний доступ до своїх найпотужніших моделей — Claude Fable 5 та Mythos. Для бізнесу та державних установ, що інтегрували чужий API у критичну інфраструктуру, таке «миттєве» рішення перетворилося з гіпотетичного ризику на реальну проблему. Відповідь Sakana є прагматичною: замість гонитви за кількістю параметрів вони навчилися збирати найкращу команду з наявних ресурсів та обходити втрачені ланки. Пул моделей є взаємозамінним, тому за недоступності Fable чи Mythos система просто перенаправляє запит іншим шляхом.
В основі розробки лежать дві праці, прийняті на конференцію ICLR 2026. TRINITY описує вдосконалений координатор, який розподіляє ролі Thinker, Worker та Verifier, вибудовуючи багатоходову взаємодію (arXiv:2512.04695). Conductor — це модель, навчена за допомогою навчання з підкріпленням генерувати плани координації природною мовою (arXiv:2512.04388). Замість жорстко прописаних алгоритмів Fugu засвоює самі патерни співпраці — саме звідси походять її гнучкість та здатність інтегрувати нові моделі одразу після їх виходу.
Представлено дві версії продукту. Базова Fugu підтримує баланс між якістю та швидкістю відгуку — це «робоча конячка» для написання коду, рев’ю та чат-ботів, зокрема всередині Codex; тут також можна виключати окремі моделі чи провайдерів із пулу задля дотримання вимог приватності та комплаєнсу. Fugu Ultra розроблена для тривалих багатоетапних завдань, де монолітні моделі втрачають контекст і накопичують помилки: відтворення наукових робіт, глибокий аналіз коду, кібербезпека, а також патентні та літературні дослідження.
Щодо цифр: Sakana порівнює Fugu з тими самими моделями, якими вона оркеструє, і на більшості етапів оркестратор випереджає кожного учасника окремо. Fugu Ultra лідирує в основних бенчмарках із програмування та в низці наукових тестів, а за заявою лабораторії, вона стає в один ряд із Fable 5 та Mythos Preview — попри те, що обох немає в пулі через відсутність публічного доступу до них. Усі сторонні результати запозичені зі звітів самих розробників, тож до них варто ставитися як до заявлених показників, а не до незалежно перевірених даних.
Стратегічна вигода базується на трьох факторах. Зменшується залежність від одного вендора: моделі різних компаній можна комбінувати за ціною, швидкістю та відповідністю стандартам. З’являється вбудована надлишковість — система обходить збої або нові обмеження конкретного постачальника. Також білінг влаштований справедливіше, ніж у класичних мультиагентних системах: при роботі кількох агентів оплата не підсумовується, а розраховується за тарифом найдорожчої моделі в ланцюжку.
Доступ здійснюється через єдиний API. Передплата має три рівні: Standard за $20 на місяць, Pro за $100 (ліміт у десять разів більший) та Max за $200 (у двадцять разів); до кінця липня другий місяць користування надається безкоштовно. Для великих навантажень діє система оплати за фактом: Fugu Ultra коштує $5 за мільйон вхідних токенів та $30 за вихідні, ціна зростає для контекстів понад 272K. Технічний звіт опубліковано на GitHub лабораторії, а продукт і консоль доступні на sakana.ai/fugu та console.sakana.ai. Важливе застереження: на старті сервіс недоступний у ЄС та ЄЕЗ — Sakana пояснює це незавершеною роботою щодо відповідності нормам GDPR.




