Sakana Fugu : le chef d'orchestre plutôt que le géant. Lancement le 22 juin depuis le Japon.

Auteur : Alex Khohlov

Sakana Fugu : le chef d'orchestre plutôt que le géant. Lancement le 22 juin depuis le Japon.-1
Sakana Fugu - comparaison dans différentes tâches avec des IA de pointe

Le 22 juin 2026, le laboratoire tokyoïte Sakana AI a ouvert l'accès public à Fugu et à sa version avancée, Fugu Ultra. Il ne s'agit pas d'un énième grand modèle de langage, mais d'un orchestrateur : un modèle entraîné qui reçoit les requêtes via un point de terminaison unique compatible OpenAI, avant de décider s'il doit agir seul ou mobiliser une équipe de modèles de pointe tiers (GPT-5.5, Claude, Gemini et d'autres, allant jusqu'à s'appeler lui-même de manière récursive). La répartition des rôles, la vérification des résultats intermédiaires et la synthèse de la réponse finale s'effectuent en interne, sans jamais solliciter le code de l'utilisateur.

L'idée n'est pas née par hasard. Le premier semestre 2026 a révélé la fragilité d'une dépendance exclusive à un seul fournisseur : le 12 juin, sous la pression d'une injonction d'exportation américaine, Anthropic a coupé l'accès public à ses modèles les plus performants, Claude Fable 5 et Mythos. Pour les entreprises et les États ayant intégré des API tierces dans leurs infrastructures critiques, ce risque d'une coupure « du jour au lendemain » n'est plus une simple hypothèse. La réponse de Sakana est pragmatique : plutôt que de courir après le nombre de paramètres, il s'agit de savoir constituer la meilleure équipe possible avec les ressources existantes et de contourner les maillons défaillants. Le pool de modèles étant interchangeable, le système redirige simplement les requêtes si Fable ou Mythos deviennent indisponibles.

À l'origine de ce projet se trouvent deux articles acceptés à l'ICLR 2026. TRINITY décrit un coordinateur évolué qui attribue les rôles de « Penseur », « Travailleur » et « Vérificateur », orchestrant ainsi une interaction complexe en plusieurs étapes (arXiv : 2512.04695). Conductor est un modèle entraîné par apprentissage par renforcement pour générer des plans de coordination en langage naturel (arXiv : 2512.04388). Au lieu de flux de travail rigides, Fugu assimile les schémas de collaboration eux-mêmes, ce qui lui confère une grande flexibilité et la capacité d'intégrer de nouveaux modèles dès leur sortie.

Deux versions sont disponibles. Fugu offre un équilibre entre qualité et latence — c'est l'outil de référence pour le code, la révision et les agents conversationnels, notamment au sein de Codex ; il permet également d'exclure certains modèles ou fournisseurs du pool pour répondre à des impératifs de confidentialité et de conformité. Fugu Ultra est conçu pour les tâches longues et complexes où les modèles monolithiques perdent le fil et accumulent les erreurs : reproduction de travaux scientifiques, analyse approfondie de code, cybersécurité, ou encore recherches de brevets et de littérature.

Concernant les chiffres, Sakana compare Fugu aux modèles qu'il orchestre précisément, et l'orchestrateur surpasse individuellement chaque participant sur la majorité des tests. Fugu Ultra domine les principaux benchmarks de programmation et plusieurs tests scientifiques, se hissant, selon le laboratoire, au niveau de Fable 5 et Mythos Preview — alors même qu'aucun de ces deux modèles n'est présent dans le pool puisque leur accès public a cessé. Tous les résultats tiers provenant des rapports des fournisseurs eux-mêmes, ils doivent être considérés comme des performances déclarées et non vérifiées de manière indépendante.

L'intérêt stratégique repose sur trois piliers. La dépendance à un fournisseur unique est réduite : les modèles de différentes entreprises peuvent être combinés selon le coût, la vitesse et la conformité. Une redondance native est instaurée, permettant au système de contourner une panne ou une nouvelle restriction chez un prestataire. Enfin, la facturation est plus transparente que dans les systèmes multi-agents classiques : lorsque plusieurs agents interviennent, les frais ne s'accumulent pas, mais sont calculés sur la base du tarif du modèle le plus onéreux de la chaîne.

L'accès se fait via une API unique. Trois niveaux d'abonnement sont proposés : Standard à 20 $ par mois, Pro à 100 $ (limite dix fois supérieure) et Max à 200 $ (limite vingt fois supérieure) ; jusqu'à fin juillet, le deuxième mois est offert. Pour les charges de travail importantes, un système de paiement à l'usage est disponible : Fugu Ultra coûte 5 $ par million de jetons en entrée et 30 $ en sortie, avec un surcoût pour les contextes dépassant 272K. Le rapport technique est consultable sur le GitHub du laboratoire, tandis que le produit et la console sont accessibles sur sakana.ai/fugu et console.sakana.ai. Une précision importante : au lancement, le service n'est pas disponible dans l'UE et l'EEE, Sakana invoquant des travaux de mise en conformité au RGPD encore en cours.

4 Vues
Avez-vous trouvé une erreur ou une inexactitude ?Nous étudierons vos commentaires dans les plus brefs délais.