Em 22 de junho de 2026, o laboratório de Tóquio Sakana AI abriu o acesso ao Fugu e à sua versão avançada, o Fugu Ultra. Não se trata de apenas mais um grande modelo de linguagem, mas sim de um orquestrador: um modelo treinado que recebe solicitações em um único endpoint compatível com OpenAI e decide, de forma autônoma, se resolverá a tarefa sozinho ou se montará uma equipe com modelos de ponta de terceiros (como GPT-5.5, Claude, Gemini e outros, chegando até a chamadas recursivas de si mesmo). A distribuição de papéis, a verificação dos resultados intermediários e a elaboração da resposta final ocorrem internamente, sem envolver o código do usuário.
A ideia não surgiu do nada. O primeiro semestre de 2026 revelou a fragilidade de apostar em um único fornecedor: em 12 de junho, sob pressão de uma ordem de exportação dos EUA, a Anthropic encerrou o acesso público aos seus modelos mais potentes — o Claude Fable 5 e o Mythos. Para empresas e governos que integraram APIs externas em infraestruturas críticas, essa decisão "do dia para a noite" deixou de ser um risco hipotético. A resposta da Sakana é pragmática: em vez de buscar o maior número de parâmetros, o foco é aprender a reunir a melhor equipe possível com o que está disponível e contornar os elos perdidos. Como o conjunto de modelos é intercambiável, o sistema simplesmente redireciona o fluxo caso o Fable ou o Mythos fiquem indisponíveis.
A base tecnológica reside em dois artigos aceitos no ICLR 2026. O TRINITY descreve um coordenador evoluído que atribui as funções de Pensador, Executor e Verificador, estabelecendo uma interação de múltiplas etapas (arXiv:2512.04695). Já o Conductor é um modelo treinado via aprendizado por reforço para gerar planos de coordenação em linguagem natural (arXiv:2512.04388). Em vez de fluxos de trabalho rígidos, o Fugu aprende os próprios padrões de colaboração — o que garante flexibilidade e a capacidade de integrar novos modelos assim que são lançados.
Existem duas versões disponíveis. O Fugu mantém o equilíbrio entre qualidade e latência, funcionando como uma ferramenta versátil para código, revisões e chatbots, inclusive dentro do Codex; nele, é possível excluir modelos ou provedores específicos para atender a requisitos de privacidade e conformidade. O Fugu Ultra é voltado para tarefas longas e complexas, onde modelos monolíticos costumam perder o contexto e acumular erros, como na reprodução de trabalhos científicos, análise profunda de código, cibersegurança e pesquisas de patentes ou literárias.
Quanto aos números, a Sakana compara o Fugu com os mesmos modelos que ele orquestra, e o sistema supera cada participante individualmente na maioria das categorias. O Fugu Ultra lidera os principais benchmarks de programação e diversos testes científicos, igualando-se, segundo o laboratório, ao Fable 5 e ao Mythos Preview — apesar de nenhum dos dois estar presente no conjunto, já que o acesso público a eles foi encerrado. Vale notar que todos os resultados de terceiros foram extraídos dos relatórios dos próprios provedores, devendo ser tratados como dados declarados e não verificados de forma independente.
A vantagem estratégica baseia-se em três pilares. Primeiro, reduz-se a dependência de um único fornecedor, permitindo combinar modelos de diferentes empresas por preço, velocidade e conformidade. Em segundo lugar, há uma redundância integrada, permitindo que o sistema contorne falhas ou novas restrições de um fornecedor específico. Por fim, o faturamento é mais transparente do que em sistemas multiagentes tradicionais: quando vários agentes atuam, o custo não é acumulado, mas calculado com base na taxa do modelo mais caro da cadeia.
O acesso é feito através de uma API unificada. A assinatura possui três níveis: Standard por US$ 20 mensais, Pro por US$ 100 (com limite dez vezes maior) e Max por US$ 200 (vinte vezes maior); até o fim de julho, o segundo mês é gratuito. Para demandas intensas, há o modelo pay-as-you-go: o Fugu Ultra custa US$ 5 por milhão de tokens de entrada e US$ 30 por milhão de saída, com valores superiores para contextos acima de 272K. O relatório técnico está disponível no GitHub do laboratório, e o produto e o console podem ser encontrados em sakana.ai/fugu e console.sakana.ai. Uma ressalva importante: no lançamento, o serviço não está disponível na UE e no EEE, com a Sakana justificando a ausência pela adequação ainda pendente ao GDPR.




