📢 Gate 广场认证创作者招募中,入驻瓜分每月 $20,000 创作大奖!
📌 参与方式
站内创作者: 成功申请“创作者认证徽章”即可自动参与。
新入驻创作者: 需填写入驻表单申请 👉️ https://www.gate.com/questionnaire/7698
🎁 创作者福利
1️⃣ 首帖见面礼: 新入驻/回归创作者发首帖,即得 $50U 奖励!
2️⃣ 周度发帖奖: 完成周发帖任务,轻松瓜分 $10,000 奖池!
3️⃣ 月度创作奖: 赛道更多样,完成月度任务瓜分 $1,600 GT 奖池!
4️⃣ 专属推广任务:进入专属创作者社群,享专属推广任务和节日礼包!
让您的优质内容被更多人看到,携手共建高质量创作者社区!
活动细节:https://www.gate.com/announcements/article/51536
OpenRouter 推 Fusion API:三模型混合逼近 Fable 5,成本僅一半
OpenRouter 于 6 月 13 日正式发布 Fusion API,让开发者通过单一 API 调用,同时调用多个模型进行平行推理,再由 Judge 模型融合出最佳答案。在 DRACO 深度研究基准测试中,Fusion 以 69% 超越 Claude Fable 5 的 65.3%,而一组由 Gemini 3 Flash、Kimi K2.6 和 DeepSeek V4 Pro 组成的低成本面板更仅差不到 1%,成本却只要一半。
(前情提要:Google 领投 AI 路由平台 OpenRouter,估值 13 亿美元一年增长 240%)
(背景补充:OpenRouter 分析 100 兆 Token 研报:人类到底用 AI 做什么、中国模型崛起与用户留存秘密)
本文目录
Toggle
人气 AI 路由平台 OpenRouter 于 6 月 13 日正式推出 Fusion API,这项全新功能允许开发者将同一问题同时派送给多个模型处理,再由一个 Judge 模型融合所有输出、提炼出最佳答案,而且只要一个 API call 就能完成。
Fusion 的核心机制相当直观:当用户传送一个 prompt,OpenRouter 会将其平行派送给一个“panel”内的数个模型(每个模型都配有 web search 与 web fetch 工具),接着 Judge 模型阅读所有 panel 回应,产生结构化分析,包含共识点、矛盾点、部分覆盖、独到见解与盲点,最后由调用模型根据这份分析写出最终答案。整个管线在服务器端执行,体验上就跟调用单一模型一模一样。
DRACO 基准实测:Fusion 全面超越单体王者
OpenRouter 团队以 Perplexity AI 的 DRACO 深度研究基准进行评测,该基准涵盖 100 道跨 10 个领域的复杂研究任务,评分标准包含事实正确性(约 20 项)、广度与深度(约 9 项)、呈现品质(约 6 项)及引用品质(约 5 项),且设有负权重机制,模型若给出错误信息会受到惩罚。
以下是各项配置的评分结果:
预算面板也能打:三模型合体只输 Fable 不到 1%
最令市场惊艳的结果来自一组“预算面板”,Gemini 3 Flash、Kimi K2.6 和 DeepSeek V4 Pro 这三个相对便宜的模型,经 Fusion 融合后拿到 64.7%,不仅击败 GPT-5.5(60.0%)和 Opus 4.8(58.8%),更只差 Claude Fable 5 不到 1 个百分点,而成本仅需后者的一半。这意味着开发者可以用更低的推理成本,获得接近顶级模型的深度研究能力。
另一个值得注意的发现是:“自己融合自己”也有效。Opus 4.8 作为 panel 中的两个成员(同型号两份)再以 Opus 4.8 作为 Judge 融合,得分 65.5%,比单一 Opus 4.8(58.8%)高出 6.7 分。这显示 Fusion 的效能提升有很大一部分来自 synthesis 步骤本身的价值,即使同一模型跑两次,不同的推理路径、不同的工具调用与来源选择,也能带来显著增益。
Fusion 不是 Fable 的取代品,但适用场景很明确
OpenRouter CEO Alex Atallah 在 X 上表示,Fusion 可达到“Fable 等级的智慧,价格只要一半”。不过团队也坦承,DRACO 基准并未包含长时间序列任务(long-horizon),而这正是 Claude Fable 5 真正的强项。对于需要多步骤推理、长时间上下文的复杂任务,Fable 短期内仍无法取代。
至于程序开发场景,Fusion 并非直接取代程序设计模型的方案。OpenRouter 将 Fusion 设计为一个 server tool,当基础模型遇到需要深度研究的问题(如架构决策、最佳实践研究)时,可以自动决定是否调用 Fusion 获取多角度分析,日常代码撰写则照旧由主模型处理。
四种调用方式一次看懂
开发者可通过以下四种方式使用 Fusion:
Fusion 预设面板的调用成本比 Fable 约低 50%,但响应时间约为标准调用的 2-3 倍(因需等待多模型平行推理后再融合)。OpenRouter 表示会持续根据用户反馈改善性能。
本文源自 OpenRouter Blog,由动区动趋编译整理。