Il 22 giugno 2026, il laboratorio Sakana AI di Tokyo ha aperto l'accesso pubblico a Fugu e alla sua versione avanzata Fugu Ultra. Non si tratta di un ennesimo modello linguistico di grandi dimensioni, bensì di un orchestratore: un sistema addestrato che riceve richieste tramite un singolo endpoint compatibile con OpenAI e decide autonomamente se procedere in solitaria o riunire un team di modelli di frontiera (come GPT-5.5, Claude, Gemini o persino richiamando ricorsivamente se stesso). La distribuzione dei ruoli, la verifica dei risultati intermedi e la sintesi della risposta finale avvengono interamente a livello interno, restando trasparenti rispetto al codice dell'utente.
L’idea non è nata dal nulla. La prima metà del 2026 ha evidenziato quanto sia rischioso puntare su un unico fornitore: il 12 giugno Anthropic, seguendo le direttive sull'esportazione degli Stati Uniti, ha interrotto l'accesso pubblico ai suoi modelli di punta, Claude Fable 5 e Mythos. Per le aziende e le amministrazioni pubbliche che hanno integrato API esterne in infrastrutture critiche, una decisione così improvvisa non rappresenta più solo un rischio ipotetico. La risposta di Sakana è pragmatica: anziché rincorrere il numero di parametri, punta a coordinare al meglio le risorse esistenti per aggirare gli anelli mancanti della catena. Essendo il parco modelli intercambiabile, il sistema bypassa l'indisponibilità di Fable o Mythos reindirizzando semplicemente il traffico altrove.
La tecnologia si fonda su due studi presentati alla conferenza ICLR 2026. TRINITY descrive un coordinatore evoluto che assegna i ruoli di Thinker, Worker e Verifier, strutturando un'interazione a più fasi (arXiv:2512.04695). Conductor è invece un modello addestrato tramite apprendimento per rinforzo per generare piani di coordinamento in linguaggio naturale (arXiv:2512.04388). Invece di affidarsi a flussi di lavoro rigidi, Fugu apprende i pattern di collaborazione, garantendo flessibilità e la capacità di integrare nuovi modelli man mano che vengono rilasciati.
Il servizio è disponibile in due versioni. Fugu offre un equilibrio ideale tra qualità e latenza, configurandosi come lo strumento ideale per la scrittura di codice, le revisioni e i chatbot, inclusi quelli interni a Codex; permette inoltre di escludere specifici modelli o fornitori per soddisfare requisiti di privacy e conformità. Fugu Ultra è invece progettato per task complessi e multi-fase, dove i modelli monolitici tendono a perdere il contesto e ad accumulare errori: riproduzione di studi scientifici, analisi profonda del codice, cybersicurezza e ricerche in ambito brevettuale o letterario.
Analizzando i numeri, Sakana mette a confronto Fugu con gli stessi modelli che esso stesso orchestra, evidenziando come l'orchestratore superi i singoli componenti nella maggior parte degli scenari. Fugu Ultra domina i principali benchmark di programmazione e diversi test scientifici; secondo il laboratorio, il modello raggiunge le prestazioni di Fable 5 e Mythos Preview, nonostante nessuno dei due sia presente nel pool a causa della loro indisponibilità pubblica. Tuttavia, è bene notare che i risultati di terze parti provengono dai report dei fornitori stessi e vanno quindi considerati come dati dichiarati e non verificati in modo indipendente.
Il vantaggio strategico è triplice. In primo luogo, si riduce la dipendenza da un singolo fornitore, permettendo di combinare modelli di diverse aziende in base a costi, velocità e conformità. In secondo luogo, si ottiene una ridondanza nativa che consente di aggirare malfunzionamenti o nuove restrizioni di un provider. Infine, il sistema di fatturazione è più trasparente rispetto ai classici sistemi multi-agente: pur impiegando più agenti, il costo non è cumulativo, ma basato sulla tariffa del modello più costoso utilizzato nella catena.
L’accesso avviene tramite un’unica API. L'abbonamento è strutturato su tre livelli: Standard a 20 dollari al mese, Pro a 100 dollari con limiti dieci volte superiori e Max a 200 dollari con limiti venti volte più alti, con il secondo mese offerto gratuitamente fino alla fine di luglio. Per i carichi di lavoro più intensi è prevista una modalità pay-as-you-go: Fugu Ultra costa 5 dollari per milione di token in entrata e 30 dollari per quelli in uscita, con tariffe più elevate per contesti oltre i 272K. Il report tecnico è consultabile sul GitHub del laboratorio, mentre il prodotto e la console sono accessibili su sakana.ai/fugu e console.sakana.ai. Una precisazione importante: al momento del lancio il servizio non è disponibile nell'UE e nello SEE, poiché Sakana cita la necessità di completare l'adeguamento al GDPR.




