Sakana Fugu: Dirigent statt Gigant – Release am 22. Juni aus Japan

Autor: Alex Khohlov

Sakana Fugu: Dirigent statt Gigant – Release am 22. Juni aus Japan-1
Sakana Fugu - Vergleich in verschiedenen Aufgaben mit führenden KI-Systemen

Am 22. Juni 2026 hat das in Tokio ansässige Labor Sakana AI den öffentlichen Zugang zu Fugu und dessen leistungsstärkerer Version Fugu Ultra freigeschaltet. Dabei handelt es sich nicht um ein weiteres großes Sprachmodell, sondern um einen Orchestrator: ein trainiertes Modell, das Anfragen über einen einzigen OpenAI-kompatiblen Endpunkt entgegennimmt und anschließend eigenständig entscheidet, ob es die Aufgabe allein bewältigt oder ein Team aus externen Frontier-Modellen (wie GPT-5.5, Claude, Gemini oder sogar rekursive Aufrufe seiner selbst) zusammenstellt. Die Rollenverteilung, die Prüfung von Zwischenergebnissen und die Erstellung der finalen Antwort erfolgen intern, ohne dass der Nutzer in den Code eingreifen muss.

Die Idee entstand keineswegs im luftleeren Raum. Die erste Hälfte des Jahres 2026 verdeutlichte, wie riskant die einseitige Abhängigkeit von einem einzigen Anbieter ist: Am 12. Juni sperrte Anthropic aufgrund einer US-Exportanweisung den öffentlichen Zugang zu seinen leistungsfähigsten Modellen Claude Fable 5 und Mythos. Für Unternehmen und staatliche Akteure, die fremde APIs in ihre kritische Infrastruktur integriert haben, ist ein solcher plötzlicher Entzug kein hypothetisches Risiko mehr. Die Antwort von Sakana fällt pragmatisch aus: Statt die Anzahl der Parameter ins Unermessliche zu treiben, konzentriert man sich darauf, das beste Team aus dem Vorhandenen zu bilden und ausgefallene Glieder in der Kette zu umgehen. Da der Pool an Modellen austauschbar ist, routet das System Anfragen bei einer Nichtverfügbarkeit von Fable oder Mythos schlichtweg an diesen vorbei.

Das Fundament bilden zwei Forschungsarbeiten, die für die ICLR 2026 angenommen wurden. TRINITY beschreibt einen hochentwickelten Koordinator, der die Rollen Thinker, Worker und Verifier zuweist und eine mehrstufige Interaktion orchestriert (arXiv:2512.04695). Conductor ist ein Modell, das mittels Reinforcement Learning darauf trainiert wurde, Koordinationspläne in natürlicher Sprache zu erstellen (arXiv:2512.04388). Anstatt auf starr programmierten Workflows zu basieren, erlernt Fugu die Muster der Zusammenarbeit selbst – woraus resultiert, dass es flexibel bleibt und neue Modelle unmittelbar nach deren Erscheinen einbinden kann.

Das System wird in zwei Varianten angeboten. Fugu bietet eine ausgewogene Mischung aus Qualität und Latenz und dient als Arbeitstier für Programmierung, Reviews und Chatbots, unter anderem innerhalb von Codex; zudem lassen sich hier einzelne Modelle oder Anbieter ausschließen, um Datenschutz- und Compliance-Anforderungen gerecht zu werden. Fugu Ultra ist hingegen auf komplexe, mehrstufige Aufgaben spezialisiert, bei denen monolithische Modelle oft den Kontext verlieren und Fehler akkumulieren, wie etwa bei der Reproduktion wissenschaftlicher Arbeiten, tiefgreifender Code-Analyse, Cybersicherheit sowie Patent- und Literaturrecherchen.

Mit Blick auf die Zahlen vergleicht Sakana sein Fugu-System mit eben jenen Modellen, die es selbst orchestriert, wobei der Orchestrator in den meisten Disziplinen die einzelnen Teilnehmer übertrifft. Fugu Ultra führt die wichtigsten Coding-Benchmarks und diverse wissenschaftliche Tests an und bewegt sich laut Angaben des Labors auf Augenhöhe mit Fable 5 und Mythos Preview – obwohl beide gar nicht im Pool enthalten sind, da kein öffentlicher Zugriff mehr besteht. Da sämtliche Vergleichswerte für externe Modelle aus den Berichten der jeweiligen Anbieter stammen, sollten sie als Herstellerangaben und nicht als unabhängig verifizierte Daten betrachtet werden.

Der strategische Nutzen ergibt sich aus drei Faktoren. Erstens sinkt die Bindung an einen einzelnen Vendor: Modelle unterschiedlicher Unternehmen lassen sich flexibel nach Preis, Geschwindigkeit und Compliance kombinieren. Zweitens entsteht eine integrierte Redundanz, da das System Ausfälle oder neue Restriktionen eines Anbieters einfach umgeht. Drittens ist die Abrechnung fairer gestaltet als bei klassischen Multi-Agenten-Systemen: Kommen mehrere Agenten zum Einsatz, summieren sich die Kosten nicht auf, sondern werden zum Satz des teuersten Modells in der Kette berechnet.

Der Zugang erfolgt über eine einheitliche API. Das Abonnement ist in drei Stufen unterteilt: Standard für 20 $ pro Monat, Pro für 100 $ (mit zehnfachem Limit) und Max für 200 $ (mit zwanzigfachem Limit); bis Ende Juli ist der zweite Monat kostenlos. Für hohe Auslastungen gibt es ein Pay-as-you-go-Modell: Fugu Ultra kostet 5 $ pro Million Input-Token und 30 $ für den Output, wobei die Preise bei Kontextfenstern über 272K ansteigen. Der technische Bericht ist auf dem GitHub des Labors zu finden, während das Produkt und die Konsole unter sakana.ai/fugu bzw. console.sakana.ai erreichbar sind. Ein wichtiger Vorbehalt bleibt: Zum Start ist der Dienst in der EU und im EWR nicht verfügbar, wobei Sakana auf noch ausstehende Arbeiten zur DSGVO-Konformität verweist.

4 Ansichten
Haben Sie einen Fehler oder eine Ungenauigkeit festgestellt?Wir werden Ihre Kommentare so schnell wie möglich berücksichtigen.