Vào ngày 22 tháng 6 năm 2026, phòng thí nghiệm Sakana AI tại Tokyo đã chính thức mở quyền truy cập công khai cho Fugu và phiên bản nâng cao Fugu Ultra. Đây không đơn thuần là một mô hình ngôn ngữ lớn khác mà là một trình điều phối (orchestrator): một mô hình đã qua đào tạo chuyên tiếp nhận yêu cầu thông qua một điểm cuối tương thích với OpenAI, sau đó tự quyết định xem nên tự xử lý đơn lẻ hay tập hợp một đội ngũ gồm các mô hình hàng đầu từ bên thứ ba (như GPT-5.5, Claude, Gemini và các mô hình khác, thậm chí là tự gọi lại chính mình theo kiểu đệ quy). Việc phân bổ vai trò, kiểm tra kết quả trung gian và tổng hợp câu trả lời cuối cùng đều diễn ra nội bộ trước khi kết quả được trả về cho mã nguồn của người dùng.
Ý tưởng này không tự nhiên mà có. Nửa đầu năm 2026 đã phơi bày sự mong manh khi đặt cược vào một nhà cung cấp duy nhất: vào ngày 12 tháng 6, dưới tác động từ lệnh xuất khẩu của Mỹ, Anthropic đã đóng quyền truy cập công khai vào các mô hình mạnh nhất của mình là Claude Fable 5 và Mythos. Đối với các doanh nghiệp và quốc gia đã tích hợp API bên thứ ba vào cơ sở hạ tầng quan trọng, một quyết định thay đổi chỉ sau một đêm như vậy không còn là rủi ro giả định nữa. Câu trả lời của Sakana mang tính thực tiễn cao: thay vì chạy đua theo số lượng tham số, họ tập trung vào việc học cách xây dựng đội ngũ tốt nhất từ những gì sẵn có và vượt qua những mắt xích bị thiếu hụt. Danh mục các mô hình có thể thay thế cho nhau, vì vậy nếu Fable hoặc Mythos không khả dụng, hệ thống sẽ đơn giản là điều hướng yêu cầu qua các lộ trình khác.
Nền tảng của hệ thống này là hai công trình nghiên cứu được chấp nhận tại hội nghị ICLR 2026. TRINITY mô tả một bộ điều phối tiến hóa chuyên phân bổ các vai trò như Người tư duy (Thinker), Người thực hiện (Worker) và Người kiểm chứng (Verifier), đồng thời thiết lập các tương tác đa bước (arXiv:2512.04695). Conductor là mô hình được đào tạo thông qua học tăng cường (reinforcement learning) để tạo ra các kế hoạch điều phối bằng ngôn ngữ tự nhiên (arXiv:2512.04388). Thay vì sử dụng các quy trình làm việc được lập trình sẵn một cách cứng nhắc, Fugu tự học các mô hình hợp tác — điều này mang lại sự linh hoạt và khả năng tích hợp các mô hình mới ngay khi chúng vừa ra mắt.
Hệ thống có hai phiên bản chính. Fugu duy trì sự cân bằng giữa chất lượng và độ trễ — một trợ thủ đắc lực cho việc lập trình, đánh giá mã nguồn và chatbot, bao gồm cả việc tích hợp bên trong Codex; tại đây, người dùng cũng có thể loại bỏ các mô hình hoặc nhà cung cấp cụ thể khỏi danh mục để đáp ứng các yêu cầu về quyền riêng tư và tuân thủ. Fugu Ultra được thiết kế dành cho các tác vụ dài và nhiều bước, nơi các mô hình nguyên khối thường mất ngữ cảnh và tích tụ sai sót: như tái hiện các công trình nghiên cứu khoa học, phân tích mã nguồn chuyên sâu, an ninh mạng, cũng như nghiên cứu bằng sáng chế và văn học.
Về các số liệu thống kê: Sakana đã so sánh Fugu với chính các mô hình mà nó điều phối, và trong hầu hết các bài kiểm tra, trình điều phối này đều vượt qua từng thành phần riêng lẻ. Fugu Ultra dẫn đầu trong các bài đo chuẩn lập trình chủ chốt và một số bài kiểm tra khoa học, đồng thời theo tuyên bố của phòng thí nghiệm, nó đạt ngang tầm với Fable 5 và Mythos Preview — mặc dù cả hai đều không có mặt trong danh mục do quyền truy cập công khai không còn tồn tại. Tất cả các kết quả từ bên thứ ba đều được lấy từ báo cáo của chính các nhà cung cấp, vì vậy chúng nên được xem là các thông số công bố thay vì các kết quả đã qua kiểm chứng độc lập.
Lợi ích chiến lược đến từ ba yếu tố cốt lõi. Đầu tiên là giảm bớt sự phụ thuộc vào một nhà cung cấp duy nhất: các mô hình từ nhiều công ty khác nhau có thể được kết hợp dựa trên giá cả, tốc độ và khả năng tuân thủ. Thứ hai là tính dự phòng tích hợp — hệ thống có thể vượt qua sự cố hoặc các hạn chế mới từ một nhà cung cấp bất kỳ. Cuối cùng, cơ chế tính phí được thiết kế công bằng hơn so với các hệ thống đa tác nhân truyền thống: khi có nhiều tác nhân cùng hoạt động, chi phí không bị cộng dồn mà được tính theo mức giá của mô hình đắt nhất trong chuỗi xử lý.
Người dùng có thể truy cập dịch vụ thông qua một API duy nhất. Gói đăng ký có ba cấp độ: Standard với giá 20 USD mỗi tháng, Pro giá 100 USD (hạn mức cao gấp 10 lần) và Max giá 200 USD (gấp 20 lần); đặc biệt, khách hàng sẽ được miễn phí tháng thứ hai nếu đăng ký trước cuối tháng 7. Đối với nhu cầu sử dụng lớn, có hình thức pay-as-you-go: Fugu Ultra có giá 5 USD cho mỗi triệu mã thông báo đầu vào và 30 USD cho đầu ra, mức giá sẽ cao hơn đối với các ngữ cảnh trên 272K. Báo cáo kỹ thuật hiện có trên GitHub của phòng thí nghiệm, trong khi sản phẩm và bảng điều khiển có tại sakana.ai/fugu và console.sakana.ai. Một lưu ý quan trọng: tại thời điểm ra mắt, dịch vụ chưa khả dụng tại EU và EEA do Sakana giải thích rằng công việc chuẩn bị cho các quy định GDPR vẫn chưa hoàn tất.




