Японский ИИ-единорог запустил Sakana Fugu: автоматический вызов различных моделей, сравнимых с Claude Mythos? Оценка производительности и цены — все в одном обзоре

多个 AI 模型协同工作、对外只呈现一个 API,Sakana AI 于 2026 年 6 月 22 日正式发布 Sakana Fugu,一套以强化学习训练的协调模型自动分配任务给多个专业 Agent 的系统。
(前情提要:Anthropic 遭美国政府「封杀」撤下 Fable 模型,外媒指三大隐忧:恐助攻中国开源 AI)
(背景补充:马斯克变身算力军火商!SpaceX 签下 Reflection 63 亿美元大单,出租 Nvidia GB300 助攻开源 AI)

本文目录

Toggle

  • 指挥官模型的工作原理
  • 比肩受限的顶级模型
  • 定价结构与市场限制

多个顶尖 AI 模型同时上场,不过只需要调用一个 API,这是 Sakana AI 在 Fugu 上的核心赌注。本周一(22 日),日本 AI 研究室 Sakana AI 正式发布 Sakana Fugu。

定位为「以系统取代单一模型」:一套自动指挥多个专业 Agent 协同工作的框架,对外只暴露一个 OpenAI 兼容的标准 API 接口。用户不需要知道后台有几个模型在运行,也不需要手动设计协作流程,一切由 Fugu 内部的指挥机制负责分派。

指挥官模型的工作原理

Fugu 的底层架构有两个创新:TRINITY 和 Conductor。

TRINITY 设计了三角分工架构:任务被拆给三种角色,「思考者(Thinker)」负责规划方案,「执行者(Worker)」负责实现,「验证者(Verifier)」负责找漏洞。

三个角色由不同的 LLM 分别担任,形成相互制衡的工作组。简单来说就是:不让同一个模型既想方案又批改答案。

Conductor 则是整个系统的核心,一个以强化学习训练的 7B 参数协调模型,负责决定每次任务要调用哪些 Agent、如何让它们沟通,以及如何整合最终输出。这个模型不依赖预先设计的工作流程,而是通过训练自己摸索出最有效的协作路径,Sakana 称之为「非直观但高效的协作模式」。

Agent 池的组成可以弹性调整。Standard 层级允许企业用户排除特定供应商或模型,以符合资料隐私或合规要求,对于不允许资料出境的机构而言,这是一个关键的差异化设计。

比肩受限的顶级模型

Sakana 用四个基准测试对比 Fugu 与前沿模型的表现。

  • SWE Bench Pro(软件工程代码修复能力):Fugu 59.0 分、Fugu Ultra 73.7 分
  • LiveCodeBench(即时程序竞赛):Fugu 92.9、Fugu Ultra 93.2
  • GPQA Diamond(研究生等级跨学科问答,难度接近博士资格考):Fugu 与 Fugu Ultra 同为 95.5
  • Humanity’s Last Exam(由全球顶尖学者设计的极难题库):Fugu 47.2、Fugu Ultra 50.0。

Sakana 宣称这些数字「在严格基准测试上比肩 Mythos Preview 和 Fable 5」,但目前还待第三方机构验证。

定价结构与市场限制

Fugu 分三个订阅层级:Standard 每月 20 美元、Pro 每月 100 美元(10 倍用量)、Max 每月 200 美元(20 倍用量),三个层级均包含 Fugu 与 Fugu Ultra 的使用权限。

另外提供企业 Token 计费方案,Fugu Ultra 费率为每百万输入 Token 5 美元、每百万输出 Token 30 美元;超过 272,000 Token 的长上下文场景,费率调整为 10 美元输入、45 美元输出。

一个值得关注的计费逻辑:Sakana 强调,在任务中协同调用更多 Agent 并不意味着费用成比例增加。定价机制依据活跃 Agent 池中最高级别的模型采用单一混合费率计算,换句话说,加入第二个或第三个 Agent 不会翻倍账单,这与自行串接多家 API 相比,在复杂任务上具有明显的成本优势。

目前最明确的限制是地理范围:Fugu 不向欧盟与欧洲经济区(EEA)的用户开放,官方理由是正在推进 GDPR 合规认证,时间未定。2026 年 7 月前完成订阅的早期用户可获得第二个月免费。

多个模型协同跑赢单一模型,这不是 Sakana 提出的新命题。他们真正主张的是:指挥官架构里的每一个 Agent 都可以替换,系统的天花板因此不被任何一个供应商锁定。

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено