Sakana Fugu:告别巨头时代的“指挥官”,6月22日于日本正式发布

作者: Alex Khohlov

Sakana Fugu:告别巨头时代的“指挥官”,6月22日于日本正式发布-1
Sakana Fugu - 在不同任务中与领先的人工智能的比较

2026年6月22日,东京 Sakana AI 实验室宣布正式开放 Fugu 及其高级版本 Fugu Ultra 的公共访问权限。这并非又一款大型语言模型,而是一个编排器:作为一个经过专门训练的模型,它通过一个兼容 OpenAI 的端点接收请求,并自主决定是独立处理,还是集结 GPT-5.5、Claude、Gemini 等顶尖第三方模型(甚至包括递归调用自身)来协同完成。角色分配、中间结果验证以及最终答案的汇总都在内部完成,无需触及用户的代码逻辑。

这一理念的诞生绝非偶然。2026年上半年暴露了过度依赖单一供应商的脆弱性:6月12日,Anthropic 受美国出口禁令影响,切断了其最强模型 Claude Fable 5 和 Mythos 的公共访问。对于将外部 API 深度整合进关键基础设施的企业和政府而言,这种“一夜之间”的断供风险已不再是假设。Sakana 的应对策略非常务实:不再追求参数规模,而是学会利用现有资源组建最优团队,并灵活绕过缺失的环节。由于模型池具有可替代性,系统会自动将针对 Fable 或 Mythos 的请求路由至其他可用模型。

其核心技术基于两篇被 ICLR 2026 接收的论文。TRINITY 描述了一种进化后的协调机制,它通过分配“思考者”、“执行者”和“验证者”角色来构建多轮交互 (arXiv:2512.04695)。Conductor 则是通过强化学习训练的模型,专门用于生成自然语言形式的协调计划 (arXiv:2512.04388)。Fugu 并没有采用硬编码的工作流,而是学习了协作模式本身,因此具备极高的灵活性,并能随着新模型的发布快速集成。

该产品分为两个版本。Fugu 在质量和延迟之间取得了平衡,是处理代码、评审和聊天机器人(包括内部 Codex)的得力助手;同时,它允许用户根据隐私和合规要求从资源池中剔除特定模型或供应商。Fugu Ultra 则专为长文本、多步骤任务设计,在这类任务中,单体模型往往容易丢失上下文并积累错误,其应用场景包括复现科学论文、深度代码分析、网络安全、专利及文献研究。

关于数据表现:Sakana 将 Fugu 与其调度的模型进行了对比,在大多数测试赛道上,这位“指挥官”的表现都超过了单个成员。Fugu Ultra 在主流编程基准测试和多项科学测试中处于领先地位;根据实验室声明,其性能已比肩 Fable 5 和 Mythos Preview——尽管这两者已因无法公开获取而未被纳入其资源池。需要说明的是,所有第三方数据均引用自供应商自身的报告,因此应将其视为官方宣称数据,而非独立审计结果。

战略优势主要体现在三个方面。首先,降低了对单一厂商的绑定感:不同公司的模型可以根据价格、速度和合规性进行混搭。其次,系统具备内置冗余——单一供应商的故障或新限制可被系统绕过。最后,其计费模式也比传统的多智能体系统更公平:在多个智能体协作时,费用并不会层层累加,而是统一按调用链中费率最高的那款模型来计算。

用户可通过统一 API 访问该服务。订阅分为三个等级:Standard 为每月 20 美元,Pro 为 100 美元(额度提升 10 倍),Max 为 200 美元(额度提升 20 倍);7 月底前订阅可享受第二个月免费。对于高负载需求,提供按需付费模式:Fugu Ultra 的输入端每百万 token 收费 5 美元,输出端为 30 美元,在超过 272K 的长上下文中费用更高。技术报告已发布在实验室的 GitHub 上,产品和控制台地址分别为 sakana.ai/fugu 和 console.sakana.ai。重要提示:由于 GDPR 合规工作尚未完成,该服务在启动初期暂不向欧盟和欧洲经济区(EEA)开放。

4 查看
你发现了错误或不准确的地方吗?我们会尽快考虑您的意见。