Cá mập AI Nhật Bản ra mắt Sakana Fugu: Gọi tự động nhiều mô hình có thể sánh ngang Claude Mythos? Xem điểm số và giá cả cùng lúc

Nhiều mô hình AI hợp tác làm việc, chỉ trình bày một API ra bên ngoài, Sakana AI chính thức ra mắt vào ngày 22 tháng 6 năm 2026 với Sakana Fugu, một hệ thống mô hình phối hợp được huấn luyện bằng học tăng cường tự động phân phối nhiệm vụ cho nhiều Agent chuyên nghiệp.
(Tiền đề: Anthropic bị chính phủ Mỹ "cấm vận" rút khỏi mô hình Fable, truyền thông nước ngoài chỉ ra ba mối lo ngại lớn: có thể giúp Trung Quốc mở nguồn AI)
(Bổ sung nền tảng: Elon Musk biến thành thương nhân vũ khí tính toán! SpaceX ký hợp đồng trị giá 63 tỷ USD Reflection, cho thuê Nvidia GB300 hỗ trợ AI mở nguồn)

Mục lục bài viết

Chuyển đổi

  • Cách hoạt động của mô hình chỉ huy
  • Các mô hình hàng đầu hạn chế về khả năng
  • Cấu trúc định giá và giới hạn thị trường

Nhiều mô hình AI hàng đầu cùng lúc ra trận, nhưng chỉ cần gọi một API, đó là cược cốt lõi của Sakana AI trên Fugu. Thứ Hai tuần này (ngày 22), phòng nghiên cứu AI Nhật Bản Sakana AI chính thức ra mắt Sakana Fugu.

Được định vị là "thay thế mô hình đơn lẻ bằng hệ thống": một khung làm việc tự động chỉ huy nhiều Agent chuyên nghiệp hợp tác, chỉ công khai một giao diện API tiêu chuẩn tương thích OpenAI. Người dùng không cần biết có bao nhiêu mô hình đang chạy phía sau, cũng không cần tự thiết kế quy trình hợp tác, mọi thứ do cơ chế chỉ huy trong Fugu đảm nhiệm phân phối.

Cách hoạt động của mô hình chỉ huy

Kiến trúc nền của Fugu có hai đổi mới: TRINITY và Conductor.

TRINITY thiết kế cấu trúc phân công tam giác: nhiệm vụ được chia cho ba vai trò, "Người suy nghĩ (Thinker)" chịu trách nhiệm lập kế hoạch, "Người thực thi (Worker)" thực hiện, "Người xác nhận (Verifier)" kiểm tra lỗi.

Ba vai trò này do các LLM khác nhau đảm nhiệm, tạo thành nhóm làm việc cân bằng lẫn nhau. Nói đơn giản là: không để cùng một mô hình vừa nghĩ ra phương án vừa chỉnh sửa câu trả lời.

Conductor là trung tâm của toàn hệ thống, một mô hình phối hợp huấn luyện bằng học tăng cường với 7 tỷ tham số, chịu trách nhiệm quyết định lần gọi Agent nào, cách chúng giao tiếp, và cách tổng hợp kết quả cuối cùng. Mô hình này không dựa trên quy trình làm việc được thiết kế sẵn, mà tự học cách hợp tác hiệu quả nhất, Sakana gọi đó là "mô hình hợp tác phi trực quan nhưng hiệu quả cao".

Hệ thống Agent có thể linh hoạt điều chỉnh. Mức Standard cho phép doanh nghiệp loại trừ nhà cung cấp hoặc mô hình cụ thể để phù hợp với yêu cầu về quyền riêng tư dữ liệu hoặc tuân thủ quy định, đây là một điểm khác biệt quan trọng đối với các tổ chức không cho phép dữ liệu ra ngoài.

Các mô hình hàng đầu hạn chế về khả năng

Sakana sử dụng bốn tiêu chuẩn để so sánh hiệu suất của Fugu với các mô hình tiên tiến.

  • SWE Bench Pro (khả năng sửa mã phần mềm): Fugu 59.0 điểm, Fugu Ultra 73.7 điểm
  • LiveCodeBench (cuộc thi lập trình thời gian thực): Fugu 92.9, Fugu Ultra 93.2
  • GPQA Diamond (hỏi đáp liên ngành cấp độ nghiên cứu sinh, độ khó gần bằng kỳ thi thạc sĩ): Fugu và Fugu Ultra cùng đạt 95.5
  • Humanity’s Last Exam (bộ câu hỏi cực khó do các học giả hàng đầu thế giới thiết kế): Fugu 47.2, Fugu Ultra 50.0.

Sakana tuyên bố các số này "tương đương Mythos Preview và Fable 5 trong các bài kiểm tra nghiêm ngặt", nhưng hiện vẫn cần xác nhận từ các tổ chức thứ ba.

Cấu trúc định giá và giới hạn thị trường

Fugu có ba cấp đăng ký: Standard 20 USD/tháng, Pro 100 USD/tháng (gấp 10 lần lượng sử dụng), Max 200 USD/tháng (gấp 20 lần), cả ba đều bao gồm quyền sử dụng Fugu và Fugu Ultra.

Ngoài ra còn có gói tính phí theo token doanh nghiệp, Fugu Ultra có mức phí 5 USD cho mỗi triệu token đầu vào, 30 USD cho mỗi triệu token đầu ra; các kịch bản dài hơn 272,000 token, phí sẽ điều chỉnh còn 10 USD đầu vào, 45 USD đầu ra.

Một điểm đáng chú ý trong cơ chế tính phí là: Sakana nhấn mạnh rằng việc phối hợp gọi nhiều Agent hơn trong nhiệm vụ không đồng nghĩa với chi phí tăng theo tỷ lệ. Cơ chế định giá dựa trên mô hình cao nhất trong nhóm Agent hoạt động, tính phí theo tỷ lệ pha trộn đơn nhất, nghĩa là thêm Agent thứ hai hoặc thứ ba sẽ không làm tăng gấp đôi hóa đơn, so với việc tích hợp nhiều API riêng lẻ, sẽ có lợi thế rõ rệt về chi phí cho các nhiệm vụ phức tạp.

Hiện tại, giới hạn rõ ràng nhất là về địa lý: Fugu không mở cho người dùng ở Liên minh Châu Âu và Khu vực Kinh tế Châu Âu (EEA), lý do chính thức là đang tiến trình đạt chứng nhận tuân thủ GDPR, thời gian chưa xác định. Người dùng đăng ký trước tháng 7 năm 2026 sẽ được tặng tháng thứ hai miễn phí.

Việc nhiều mô hình hợp tác chạy thắng mô hình đơn lẻ không phải là đề xuất mới của Sakana. Họ thực sự muốn nhấn mạnh rằng: trong kiến trúc chỉ huy, mỗi Agent đều có thể thay thế, giới hạn của hệ thống không bị khóa chặt bởi bất kỳ nhà cung cấp nào.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim