OpenRouter 推 Fusion API：三模型混合逼近 Fable 5，成本僅一半

2026-06-15 04:55:28

OpenRouter 于 6 月 13 日正式发布 Fusion API，让开发者通过单一 API 调用，同时调用多个模型进行平行推理，再由 Judge 模型融合出最佳答案。在 DRACO 深度研究基准测试中，Fusion 以 69% 超越 Claude Fable 5 的 65.3%，而一组由 Gemini 3 Flash、Kimi K2.6 和 DeepSeek V4 Pro 组成的低成本面板更仅差不到 1%，成本却只要一半。
（前情提要：Google 领投 AI 路由平台 OpenRouter，估值 13 亿美元一年增长 240%）
（背景补充：OpenRouter 分析 100 兆 Token 研报：人类到底用 AI 做什么、中国模型崛起与用户留存秘密）

本文目录

Toggle

DRACO 基准实测：Fusion 全面超越单体王者
预算面板也能打：三模型合体只输 Fable 不到 1%
Fusion 不是 Fable 的取代品，但适用场景很明确
四种调用方式一次看懂

人气 AI 路由平台 OpenRouter 于 6 月 13 日正式推出 Fusion API，这项全新功能允许开发者将同一问题同时派送给多个模型处理，再由一个 Judge 模型融合所有输出、提炼出最佳答案，而且只要一个 API call 就能完成。

Fusion 的核心机制相当直观：当用户传送一个 prompt，OpenRouter 会将其平行派送给一个“panel”内的数个模型（每个模型都配有 web search 与 web fetch 工具），接着 Judge 模型阅读所有 panel 回应，产生结构化分析，包含共识点、矛盾点、部分覆盖、独到见解与盲点，最后由调用模型根据这份分析写出最终答案。整个管线在服务器端执行，体验上就跟调用单一模型一模一样。

DRACO 基准实测：Fusion 全面超越单体王者

OpenRouter 团队以 Perplexity AI 的 DRACO 深度研究基准进行评测，该基准涵盖 100 道跨 10 个领域的复杂研究任务，评分标准包含事实正确性（约 20 项）、广度与深度（约 9 项）、呈现品质（约 6 项）及引用品质（约 5 项），且设有负权重机制，模型若给出错误信息会受到惩罚。

以下是各项配置的评分结果：

Fusion（Fable 5 + GPT-5.5 → Opus 4.8 融合）：69.0% 🥇
Fusion（Opus 4.8 + GPT-5.5 + Gemini 3.1 Pro → Opus 4.8 融合）：68.3%
Fusion（Opus 4.8 + GPT-5.5 → Opus 4.8 融合）：67.6%
Fusion（Opus 4.8 融合自身）：65.5%
Claude Fable 5 单体：65.3%（仅完成 93/100 题，因内容过滤器阻挡）
Fusion（Gemini 3 Flash + Kimi K2.6 + DeepSeek V4 Pro → Opus 4.8 融合）：64.7% 🔥
DeepSeek V4 Pro 单体：60.3%
GPT-5.5 单体：60.0%
Claude Opus 4.8 单体：58.8%

预算面板也能打：三模型合体只输 Fable 不到 1%

最令市场惊艳的结果来自一组“预算面板”，Gemini 3 Flash、Kimi K2.6 和 DeepSeek V4 Pro 这三个相对便宜的模型，经 Fusion 融合后拿到 64.7%，不仅击败 GPT-5.5（60.0%）和 Opus 4.8（58.8%），更只差 Claude Fable 5 不到 1 个百分点，而成本仅需后者的一半。这意味着开发者可以用更低的推理成本，获得接近顶级模型的深度研究能力。

另一个值得注意的发现是：“自己融合自己”也有效。Opus 4.8 作为 panel 中的两个成员（同型号两份）再以 Opus 4.8 作为 Judge 融合，得分 65.5%，比单一 Opus 4.8（58.8%）高出 6.7 分。这显示 Fusion 的效能提升有很大一部分来自 synthesis 步骤本身的价值，即使同一模型跑两次，不同的推理路径、不同的工具调用与来源选择，也能带来显著增益。

Fusion 不是 Fable 的取代品，但适用场景很明确

OpenRouter CEO Alex Atallah 在 X 上表示，Fusion 可达到“Fable 等级的智慧，价格只要一半”。不过团队也坦承，DRACO 基准并未包含长时间序列任务（long-horizon），而这正是 Claude Fable 5 真正的强项。对于需要多步骤推理、长时间上下文的复杂任务，Fable 短期内仍无法取代。

至于程序开发场景，Fusion 并非直接取代程序设计模型的方案。OpenRouter 将 Fusion 设计为一个 server tool，当基础模型遇到需要深度研究的问题（如架构决策、最佳实践研究）时，可以自动决定是否调用 Fusion 获取多角度分析，日常代码撰写则照旧由主模型处理。

四种调用方式一次看懂

开发者可通过以下四种方式使用 Fusion：

Chatroom 试玩：直接到 openrouter.ai/fusion 选 preset 或自建 panel
Model slug：API 中指定 “model”: “openrouter/fusion”，自动带入前沿面板
Server tool：在 tools 数组中加入 {“type”: “openrouter:fusion”}，让主模型自主决定何时调用
Plugin 模式：在 API 调用中加入 plugins 参数，自定义 panel 模型组合

Fusion 预设面板的调用成本比 Fable 约低 50%，但响应时间约为标准调用的 2-3 倍（因需等待多模型平行推理后再融合）。OpenRouter 表示会持续根据用户反馈改善性能。

本文源自 OpenRouter Blog，由动区动趋编译整理。

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

赞赏
点赞
评论
转发
分享

请输入评论内容

暂无评论

热门话题
查看更多
#
我的Gate交易时刻
32.25万热度
#
TradFiCFD黄金大师赛
201.22万热度
#
预测世界杯西班牙VS佛得角
75.93万热度
#
持有USD1即享收益
9.69万热度
#
比特币反弹
5.89亿热度

OpenRouter 推 Fusion API：三模型混合逼近 Fable 5，成本僅一半

DRACO 基准实测：Fusion 全面超越单体王者

预算面板也能打：三模型合体只输 Fable 不到 1%

Fusion 不是 Fable 的取代品，但适用场景很明确

四种调用方式一次看懂

热门话题

我的Gate交易时刻

TradFiCFD黄金大师赛

预测世界杯西班牙VS佛得角

持有USD1即享收益

比特币反弹

置顶