Sakana Fugu：AI 界的指揮家而非巨頭。6 月 22 日於日本正式發布。

17:00, 23 六月

2026 年 6 月 22 日，總部位於東京的 Sakana AI 實驗室宣佈正式對公眾開放 Fugu 及其進階版本 Fugu Ultra。這並非另一款傳統的大型語言模型，而是一個「協調者」（Orchestrator）：這款經過訓練的模型透過單一相容於 OpenAI 的端點接收請求，並自行決定是獨立完成任務，還是徵集各家頂尖模型（如 GPT-5.5、Claude、Gemini 等，甚至是對自身的遞迴調用）組建協作團隊。角色分配、中間結果校驗以及最終回答的彙整，全部在系統內部完成，用戶端代碼無需處理任何複雜邏輯。

該構想並非憑空而生。2026 年上半年揭示了過度依賴單一供應商的脆弱性：6 月 12 日，Anthropic 受美國出口禁令影響，停止了對其最強大模型 Claude Fable 5 和 Mythos 的公眾訪問。對於那些將第三方 API 整合進關鍵基礎設施的企業與政府而言，這種「一夜之間」的服務中斷已不再是假想的風險。Sakana 的應對方式相當務實：與其盲目追求參數數量，不如學習如何利用現有資源組建最佳團隊，並靈活避開失效的環節。由於模型池具備互換性，當 Fable 或 Mythos 無法使用時，系統只需將請求自動路由至其他模型。

該技術核心源於兩篇被 ICLR 2026 收錄的研究論文。TRINITY 描述了一種進化的協調機制，能將任務分配給「思考者」（Thinker）、「執行者」（Worker）與「驗證者」（Verifier），並建構多輪互動流程 (arXiv:2512.04695)。Conductor 則是一款透過強化學習訓練的模型，旨在以自然語言生成任務協調計畫 (arXiv:2512.04388)。Fugu 捨棄了硬性規定的工作流，轉而學習協作模式本身，這使其具備極高的靈活性，並能隨時接納新發布的模型。

該產品提供兩個版本。標準版 Fugu 在品質與延遲之間取得了平衡，是處理程式碼、審閱及聊天機器人（含 Codex 應用）的主力工具，並可依隱私合規需求排除特定供應商。Fugu Ultra 則專為長篇幅、多步驟任務設計，旨在解決單體模型易失上下文且誤差累積的問題，適用於學術重現、深度代碼分析、網路安全及專利文獻檢索等場景。

在數據方面，Sakana 將 Fugu 與其所協調的模型進行了對比，結果顯示在多數測試項目中，這位「指揮家」的表現優於任何單一成員。Fugu Ultra 在主流程式碼基準測試及多項科學測試中均處於領先地位，實驗室聲稱其性能已可媲美 Fable 5 與 Mythos Preview — 儘管由於不再公開，這兩款模型並未包含在目前的模型池中。由於所有第三方數據均引用自供應商自家的報告，因此應將其視為官方宣稱數據，而非經由獨立機構複核的結果。

其策略優勢主要體現在三個方面。首先是降低了對單一廠商的依賴：用戶可以根據價格、速度和合規性混合搭配不同公司的模型。其次是具備內建的備援機制：當某個供應商發生故障或面臨新限制時，系統會自動繞過障礙。最後，計費方式比傳統的多智能體系統更公平：當多個代理協作時，費用並非簡單累加，而是依照鏈條中最貴模型的費率計算。

用戶可透過統一的 API 進行訪問。訂閱方案分為三級：標準版（Standard）每月 20 美元、專業版（Pro）100 美元（配額增加十倍）、最高級（Max）200 美元（配額增加二十倍）；在 7 月底前加入，可享第二個月免費。針對高負荷需求則提供隨用隨付方案：Fugu Ultra 每百萬輸入 token 收費 5 美元，輸出 30 美元，若上下文超過 272K 則價格更高。技術報告已發布於實驗室的 GitHub，產品頁面與控制台則分別位於 sakana.ai/fugu 和 console.sakana.ai。需要注意的是，受限於尚未完成的 GDPR 合規工作，該服務在啟動初期暫不支援歐盟及歐洲經濟區（EEA）。

Sakana

Sakana Fugu

AI Agent

24 浏览量

通知中心

Sakana Fugu：AI 界的指揮家而非巨頭。6 月 22 日於日本正式發布。

阅读更多关于此主题的文章：