Sakana Fugu: дирижёр вместо гиганта. Релиз 22 июня из Японии.

17:00, 23 июня

22 июня 2026 года токийская лаборатория Sakana AI открыла общий доступ к Fugu и его старшей версии Fugu Ultra. Это не очередная большая языковая модель, а оркестратор: обученная модель, которая принимает запрос на один OpenAI-совместимый endpoint, а дальше сама решает — справиться в одиночку или собрать команду из сторонних frontier-моделей (GPT-5.5, Claude, Gemini и других, вплоть до рекурсивного вызова самой себя). Распределение ролей, проверка промежуточных результатов и сборка финального ответа происходят внутри, не доходя до кода пользователя.

Идея родилась не на пустом месте. Первая половина 2026-го обнажила хрупкость ставки на одного поставщика: 12 июня Anthropic под действием американского экспортного предписания закрыла публичный доступ к своим самым мощным моделям — Claude Fable 5 и Mythos. Для компаний и государств, встроивших чужой API в критическую инфраструктуру, такое решение «в одну ночь» — уже не гипотетический риск. Ответ Sakana прагматичен: не гнаться за числом параметров, а научиться собирать лучшую команду из того, что уже есть, и обходить выпавшие звенья. Пул моделей взаимозаменяем, поэтому недоступность Fable или Mythos система просто маршрутизирует мимо.

В основе — две работы, принятые на ICLR 2026. TRINITY описывает эволюционировавший координатор, который раздаёт роли Thinker, Worker и Verifier и выстраивает многоходовое взаимодействие (arXiv:2512.04695). Conductor — модель, обученная через reinforcement learning генерировать планы координации на естественном языке (arXiv:2512.04388). Вместо жёстко прописанных workflow Fugu выучивает сами паттерны сотрудничества — отсюда и гибкость, и способность подхватывать новые модели по мере их выхода.

Версий две. Fugu держит баланс качества и латентности — рабочая лошадка для кода, ревью и чат-ботов, в том числе внутри Codex; здесь же можно исключать отдельные модели или провайдеров из пула под требования приватности и комплаенса. Fugu Ultra заточена под длинные многошаговые задачи, где монолитные модели теряют контекст и копят ошибки: воспроизведение научных работ, глубокий анализ кода, cybersecurity, патентные и литературные разыскания.

Что до цифр: Sakana сравнивает Fugu с теми самыми моделями, которые он и оркестрирует, и на большинстве дорожек оркестратор обходит каждого из участников по отдельности. Fugu Ultra лидирует на основных кодинговых бенчмарках и в ряде научных тестов, а по заявлению лаборатории встаёт вровень с Fable 5 и Mythos Preview — при том что обеих в пуле нет, поскольку публичного доступа к ним больше не существует. Все сторонние результаты взяты из отчётов самих провайдеров, так что относиться к ним стоит как к заявленным, а не независимо перепроверенным.

Стратегическая выгода складывается из трёх вещей. Снижается привязка к одному вендору: модели разных компаний можно микшировать по цене, скорости и комплаенсу. Появляется встроенная избыточность — сбой или новое ограничение у одного поставщика система обходит. И биллинг устроен честнее, чем у классических мульти-агентных систем: при работе нескольких агентов платёж не «стекается», а считается по ставке самой дорогой модели в цепочке.

Доступ — через единый API. Подписка идёт тремя уровнями: Standard за $20 в месяц, Pro за $100 (лимит вдесятеро больше) и Max за $200 (в двадцать раз); до конца июля второй месяц дают бесплатно. Для тяжёлых нагрузок есть pay-as-you-go: Fugu Ultra стоит $5 за миллион входных токенов и $30 за выходные, дороже — на контекстах свыше 272K. Технический отчёт лежит на GitHub лаборатории, продукт и консоль — на sakana.ai/fugu и console.sakana.ai. Важная оговорка: на старте сервис недоступен в ЕС и ЕЭЗ — Sakana ссылается на незавершённую работу по GDPR.

Sakana