Sakana Fugu：告别巨头时代的“指挥官”，6月22日于日本正式发布

17:00, 23 六月

2026年6月22日，东京 Sakana AI 实验室宣布正式开放 Fugu 及其高级版本 Fugu Ultra 的公共访问权限。这并非又一款大型语言模型，而是一个编排器：作为一个经过专门训练的模型，它通过一个兼容 OpenAI 的端点接收请求，并自主决定是独立处理，还是集结 GPT-5.5、Claude、Gemini 等顶尖第三方模型（甚至包括递归调用自身）来协同完成。角色分配、中间结果验证以及最终答案的汇总都在内部完成，无需触及用户的代码逻辑。

这一理念的诞生绝非偶然。2026年上半年暴露了过度依赖单一供应商的脆弱性：6月12日，Anthropic 受美国出口禁令影响，切断了其最强模型 Claude Fable 5 和 Mythos 的公共访问。对于将外部 API 深度整合进关键基础设施的企业和政府而言，这种“一夜之间”的断供风险已不再是假设。Sakana 的应对策略非常务实：不再追求参数规模，而是学会利用现有资源组建最优团队，并灵活绕过缺失的环节。由于模型池具有可替代性，系统会自动将针对 Fable 或 Mythos 的请求路由至其他可用模型。

其核心技术基于两篇被 ICLR 2026 接收的论文。TRINITY 描述了一种进化后的协调机制，它通过分配“思考者”、“执行者”和“验证者”角色来构建多轮交互 (arXiv:2512.04695)。Conductor 则是通过强化学习训练的模型，专门用于生成自然语言形式的协调计划 (arXiv:2512.04388)。Fugu 并没有采用硬编码的工作流，而是学习了协作模式本身，因此具备极高的灵活性，并能随着新模型的发布快速集成。

该产品分为两个版本。Fugu 在质量和延迟之间取得了平衡，是处理代码、评审和聊天机器人（包括内部 Codex）的得力助手；同时，它允许用户根据隐私和合规要求从资源池中剔除特定模型或供应商。Fugu Ultra 则专为长文本、多步骤任务设计，在这类任务中，单体模型往往容易丢失上下文并积累错误，其应用场景包括复现科学论文、深度代码分析、网络安全、专利及文献研究。

关于数据表现：Sakana 将 Fugu 与其调度的模型进行了对比，在大多数测试赛道上，这位“指挥官”的表现都超过了单个成员。Fugu Ultra 在主流编程基准测试和多项科学测试中处于领先地位；根据实验室声明，其性能已比肩 Fable 5 和 Mythos Preview——尽管这两者已因无法公开获取而未被纳入其资源池。需要说明的是，所有第三方数据均引用自供应商自身的报告，因此应将其视为官方宣称数据，而非独立审计结果。

战略优势主要体现在三个方面。首先，降低了对单一厂商的绑定感：不同公司的模型可以根据价格、速度和合规性进行混搭。其次，系统具备内置冗余——单一供应商的故障或新限制可被系统绕过。最后，其计费模式也比传统的多智能体系统更公平：在多个智能体协作时，费用并不会层层累加，而是统一按调用链中费率最高的那款模型来计算。

用户可通过统一 API 访问该服务。订阅分为三个等级：Standard 为每月 20 美元，Pro 为 100 美元（额度提升 10 倍），Max 为 200 美元（额度提升 20 倍）；7 月底前订阅可享受第二个月免费。对于高负载需求，提供按需付费模式：Fugu Ultra 的输入端每百万 token 收费 5 美元，输出端为 30 美元，在超过 272K 的长上下文中费用更高。技术报告已发布在实验室的 GitHub 上，产品和控制台地址分别为 sakana.ai/fugu 和 console.sakana.ai。重要提示：由于 GDPR 合规工作尚未完成，该服务在启动初期暂不向欧盟和欧洲经济区（EEA）开放。

Sakana

Sakana Fugu

AI Agent

24 查看

通知中心

Sakana Fugu：告别巨头时代的“指挥官”，6月22日于日本正式发布

阅读更多关于此主题的文章：