OpenRouter 推 Fusion API:三模型混合逼近 Fable 5,成本僅一半

OpenRouter 于 6 月 13 日正式发布 Fusion API,让开发者通过单一 API 调用,同时调用多个模型进行平行推理,再由 Judge 模型融合出最佳答案。在 DRACO 深度研究基准测试中,Fusion 以 69% 超越 Claude Fable 5 的 65.3%,而一组由 Gemini 3 Flash、Kimi K2.6 和 DeepSeek V4 Pro 组成的低成本面板更仅差不到 1%,成本却只要一半。
(前情提要:Google 领投 AI 路由平台 OpenRouter,估值 13 亿美元一年增长 240%)
(背景补充:OpenRouter 分析 100 兆 Token 研报:人类到底用 AI 做什么、中国模型崛起与用户留存秘密)

本文目录

Toggle

  • DRACO 基准实测:Fusion 全面超越单体王者
  • 预算面板也能打:三模型合体只输 Fable 不到 1%
  • Fusion 不是 Fable 的取代品,但适用场景很明确
  • 四种调用方式一次看懂

人气 AI 路由平台 OpenRouter 于 6 月 13 日正式推出 Fusion API,这项全新功能允许开发者将同一问题同时派送给多个模型处理,再由一个 Judge 模型融合所有输出、提炼出最佳答案,而且只要一个 API call 就能完成。

Fusion 的核心机制相当直观:当用户传送一个 prompt,OpenRouter 会将其平行派送给一个“panel”内的数个模型(每个模型都配有 web search 与 web fetch 工具),接着 Judge 模型阅读所有 panel 回应,产生结构化分析,包含共识点、矛盾点、部分覆盖、独到见解与盲点,最后由调用模型根据这份分析写出最终答案。整个管线在服务器端执行,体验上就跟调用单一模型一模一样。

DRACO 基准实测:Fusion 全面超越单体王者

OpenRouter 团队以 Perplexity AI 的 DRACO 深度研究基准进行评测,该基准涵盖 100 道跨 10 个领域的复杂研究任务,评分标准包含事实正确性(约 20 项)、广度与深度(约 9 项)、呈现品质(约 6 项)及引用品质(约 5 项),且设有负权重机制,模型若给出错误信息会受到惩罚。

以下是各项配置的评分结果:

  • Fusion(Fable 5 + GPT-5.5 → Opus 4.8 融合):69.0% 🥇
  • Fusion(Opus 4.8 + GPT-5.5 + Gemini 3.1 Pro → Opus 4.8 融合):68.3%
  • Fusion(Opus 4.8 + GPT-5.5 → Opus 4.8 融合):67.6%
  • Fusion(Opus 4.8 融合自身):65.5%
  • Claude Fable 5 单体:65.3%(仅完成 93/100 题,因内容过滤器阻挡)
  • Fusion(Gemini 3 Flash + Kimi K2.6 + DeepSeek V4 Pro → Opus 4.8 融合):64.7% 🔥
  • DeepSeek V4 Pro 单体:60.3%
  • GPT-5.5 单体:60.0%
  • Claude Opus 4.8 单体:58.8%

预算面板也能打:三模型合体只输 Fable 不到 1%

最令市场惊艳的结果来自一组“预算面板”,Gemini 3 Flash、Kimi K2.6 和 DeepSeek V4 Pro 这三个相对便宜的模型,经 Fusion 融合后拿到 64.7%,不仅击败 GPT-5.5(60.0%)和 Opus 4.8(58.8%),更只差 Claude Fable 5 不到 1 个百分点,而成本仅需后者的一半。这意味着开发者可以用更低的推理成本,获得接近顶级模型的深度研究能力。

另一个值得注意的发现是:“自己融合自己”也有效。Opus 4.8 作为 panel 中的两个成员(同型号两份)再以 Opus 4.8 作为 Judge 融合,得分 65.5%,比单一 Opus 4.8(58.8%)高出 6.7 分。这显示 Fusion 的效能提升有很大一部分来自 synthesis 步骤本身的价值,即使同一模型跑两次,不同的推理路径、不同的工具调用与来源选择,也能带来显著增益。

Fusion 不是 Fable 的取代品,但适用场景很明确

OpenRouter CEO Alex Atallah 在 X 上表示,Fusion 可达到“Fable 等级的智慧,价格只要一半”。不过团队也坦承,DRACO 基准并未包含长时间序列任务(long-horizon),而这正是 Claude Fable 5 真正的强项。对于需要多步骤推理、长时间上下文的复杂任务,Fable 短期内仍无法取代。

至于程序开发场景,Fusion 并非直接取代程序设计模型的方案。OpenRouter 将 Fusion 设计为一个 server tool,当基础模型遇到需要深度研究的问题(如架构决策、最佳实践研究)时,可以自动决定是否调用 Fusion 获取多角度分析,日常代码撰写则照旧由主模型处理。

四种调用方式一次看懂

开发者可通过以下四种方式使用 Fusion:

  • Chatroom 试玩:直接到 openrouter.ai/fusion 选 preset 或自建 panel
  • Model slug:API 中指定 “model”: “openrouter/fusion”,自动带入前沿面板
  • Server tool:在 tools 数组中加入 {“type”: “openrouter:fusion”},让主模型自主决定何时调用
  • Plugin 模式:在 API 调用中加入 plugins 参数,自定义 panel 模型组合

Fusion 预设面板的调用成本比 Fable 约低 50%,但响应时间约为标准调用的 2-3 倍(因需等待多模型平行推理后再融合)。OpenRouter 表示会持续根据用户反馈改善性能。

本文源自 OpenRouter Blog,由动区动趋编译整理。

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论