Sakana AI 發布多智能體系統Fugu:跑分超越GPT5.4與Opus4.6

金色財經報導,日本 AI 研發公司 Sakana AI 宣布推出旗艦商用產品 Sakana Fugu,並開放早期 Beta 測試申請。系統定位為多智能體編排系統,以兼容 OpenAI 格式的單模型 API 形式提供服務,包含側重低延遲優化的 Sakana Fugu Mini 與面向嚴苛任務的 Sakana Fugu Ultra。
產品架構基於團隊在 ICLR 2026 發表的 Trinity 與 Conductor 論文。系統核心為一個自律學習的輕量級語言模型,無需依靠人工預設的團隊角色或固定流水線,而是根據任務難度動態調用 Worker 模型池並分配分工。系統同時支持測試時縮放,具備自適應遞歸調用能力。模型能夠將自身先前的輸出作為上下文進行讀取,從而在運行中自主識別缺陷並啟動糾錯工作流程,使用者可將遞歸深度作為推理時可調的算力軸。
評測數據顯示,在硬核推理與編碼基準測試中,Sakana Fugu Ultra 展現出超越前沿單模型的表現。在 GPQAD、LCBv6 與 SWEPro 測試中,Sakana Fugu Ultra 分別取得 95.1、93.2 和 54.2 的成績,表現優於 GPT 5.4、Gemini 3.1 以及 Opus 4.6 等主流旗艦單模型。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆