Sakana Fugu:AI 界的指揮家而非巨頭。6 月 22 日於日本正式發布。

作者: Alex Khohlov

Sakana Fugu:AI 界的指揮家而非巨頭。6 月 22 日於日本正式發布。-1
Sakana Fugu - 在不同任務中與領先的人工智慧的比較

2026 年 6 月 22 日,總部位於東京的 Sakana AI 實驗室宣佈正式對公眾開放 Fugu 及其進階版本 Fugu Ultra。這並非另一款傳統的大型語言模型,而是一個「協調者」(Orchestrator):這款經過訓練的模型透過單一相容於 OpenAI 的端點接收請求,並自行決定是獨立完成任務,還是徵集各家頂尖模型(如 GPT-5.5、Claude、Gemini 等,甚至是對自身的遞迴調用)組建協作團隊。角色分配、中間結果校驗以及最終回答的彙整,全部在系統內部完成,用戶端代碼無需處理任何複雜邏輯。

該構想並非憑空而生。2026 年上半年揭示了過度依賴單一供應商的脆弱性:6 月 12 日,Anthropic 受美國出口禁令影響,停止了對其最強大模型 Claude Fable 5 和 Mythos 的公眾訪問。對於那些將第三方 API 整合進關鍵基礎設施的企業與政府而言,這種「一夜之間」的服務中斷已不再是假想的風險。Sakana 的應對方式相當務實:與其盲目追求參數數量,不如學習如何利用現有資源組建最佳團隊,並靈活避開失效的環節。由於模型池具備互換性,當 Fable 或 Mythos 無法使用時,系統只需將請求自動路由至其他模型。

該技術核心源於兩篇被 ICLR 2026 收錄的研究論文。TRINITY 描述了一種進化的協調機制,能將任務分配給「思考者」(Thinker)、「執行者」(Worker)與「驗證者」(Verifier),並建構多輪互動流程 (arXiv:2512.04695)。Conductor 則是一款透過強化學習訓練的模型,旨在以自然語言生成任務協調計畫 (arXiv:2512.04388)。Fugu 捨棄了硬性規定的工作流,轉而學習協作模式本身,這使其具備極高的靈活性,並能隨時接納新發布的模型。

該產品提供兩個版本。標準版 Fugu 在品質與延遲之間取得了平衡,是處理程式碼、審閱及聊天機器人(含 Codex 應用)的主力工具,並可依隱私合規需求排除特定供應商。Fugu Ultra 則專為長篇幅、多步驟任務設計,旨在解決單體模型易失上下文且誤差累積的問題,適用於學術重現、深度代碼分析、網路安全及專利文獻檢索等場景。

在數據方面,Sakana 將 Fugu 與其所協調的模型進行了對比,結果顯示在多數測試項目中,這位「指揮家」的表現優於任何單一成員。Fugu Ultra 在主流程式碼基準測試及多項科學測試中均處於領先地位,實驗室聲稱其性能已可媲美 Fable 5 與 Mythos Preview — 儘管由於不再公開,這兩款模型並未包含在目前的模型池中。由於所有第三方數據均引用自供應商自家的報告,因此應將其視為官方宣稱數據,而非經由獨立機構複核的結果。

其策略優勢主要體現在三個方面。首先是降低了對單一廠商的依賴:用戶可以根據價格、速度和合規性混合搭配不同公司的模型。其次是具備內建的備援機制:當某個供應商發生故障或面臨新限制時,系統會自動繞過障礙。最後,計費方式比傳統的多智能體系統更公平:當多個代理協作時,費用並非簡單累加,而是依照鏈條中最貴模型的費率計算。

用戶可透過統一的 API 進行訪問。訂閱方案分為三級:標準版(Standard)每月 20 美元、專業版(Pro)100 美元(配額增加十倍)、最高級(Max)200 美元(配額增加二十倍);在 7 月底前加入,可享第二個月免費。針對高負荷需求則提供隨用隨付方案:Fugu Ultra 每百萬輸入 token 收費 5 美元,輸出 30 美元,若上下文超過 272K 則價格更高。技術報告已發布於實驗室的 GitHub,產品頁面與控制台則分別位於 sakana.ai/fugu 和 console.sakana.ai。需要注意的是,受限於尚未完成的 GDPR 合規工作,該服務在啟動初期暫不支援歐盟及歐洲經濟區(EEA)。

4 浏览量
发现错误或不准确的地方吗?我们会尽快处理您的评论。