Sakana AI phát hành hệ thống đa tác nhân Fugu: điểm số vượt xa GPT5.4 và Opus4.6

Báo cáo của 金色财经, công ty phát triển AI của Nhật Bản Sakana AI công bố ra mắt sản phẩm thương mại chủ đạo Sakana Fugu và mở đơn đăng ký thử nghiệm Beta sớm.
Hệ thống được định vị là hệ thống phối hợp đa tác nhân, cung cấp dịch vụ dưới dạng API mô hình đơn phù hợp với định dạng của OpenAI, bao gồm Sakana Fugu Mini tối ưu hóa độ trễ thấp và Sakana Fugu Ultra dành cho nhiệm vụ khắt khe.
Kiến trúc sản phẩm dựa trên các bài báo Trinity và Conductor của nhóm đã công bố tại ICLR 2026.
Hệ thống cốt lõi là một mô hình ngôn ngữ nhẹ tự học, không cần dựa vào vai trò nhóm do con người đặt trước hoặc dây chuyền cố định, mà dựa trên độ khó của nhiệm vụ để động viên Pool Worker mô hình và phân chia công việc một cách linh hoạt.
Hệ thống cũng hỗ trợ mở rộng trong quá trình thử nghiệm, có khả năng gọi đệ quy tự thích nghi.
Mô hình có thể đọc các đầu ra trước đó của chính nó như ngữ cảnh, từ đó tự nhận diện các thiếu sót trong quá trình chạy và kích hoạt quy trình sửa lỗi, người dùng có thể điều chỉnh độ sâu đệ quy như một trục tính toán có thể điều chỉnh trong suy luận.
Dữ liệu đánh giá cho thấy, trong các bài kiểm tra chuẩn mực về suy luận cứng và mã hóa, Sakana Fugu Ultra thể hiện vượt trội so với các mô hình đơn hàng đầu.
Trong các bài kiểm tra GPQAD, LCBv6 và SWEPro, Sakana Fugu Ultra lần lượt đạt điểm 95.1, 93.2 và 54.2, vượt xa các mô hình đơn hàng chủ đạo như GPT 5.4, Gemini 3.1 và Opus 4.6.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim