OpenRouter 推 Fusion API:三模型混合逼近 Fable 5,コストはわずか半分

OpenRouter は 6 月 13 日に正式に Fusion API を発表し、開発者が単一の API 呼び出しで複数のモデルを並列推論させ、その後 Judge モデルが最適な回答を融合する仕組みを実現しました。DRACO 深度研究基準テストにおいて、Fusion は 69% のスコアで Claude Fable 5 の 65.3% を超え、Gemini 3 Flash、Kimi K2.6、DeepSeek V4 Pro からなる低コストパネルはわずか1%未満差で追随し、コストは半分程度に抑えられています。
(前提情報:Google がリードする AI ルーティングプラットフォーム OpenRouter は、評価額 13 億ドルで1年で240%成長)
(補足背景:OpenRouter は 100兆トークンの分析レポート:「人類はAIを何に使っているのか」「中国モデルの台頭とユーザー定着の秘密」)

この記事目次

Toggle

  • DRACO基準実測:Fusionは単体モデルを全面的に超越
  • 予算パネルでも勝てる:三モデル合体はFableにわずか1%未満差
  • FusionはFableの代替品ではないが、適用シーンは明確
  • 4つの呼び出し方式を一度に理解

人気のAIルーティングプラットフォームOpenRouterは6月13日にFusion APIを正式リリースしました。この新機能により、開発者は同一の問いを複数のモデルに同時に送信し、Judgeモデルがすべての出力を融合・分析して最良の回答を導き出すことが可能となり、APIコールは一つだけで完結します。

Fusionの仕組みは非常に直感的です:ユーザーがプロンプトを送信すると、OpenRouterはそれを「パネル」内の複数モデル(各モデルにはWeb検索とWebフェッチツールが付属)に並列送信します。その後Judgeモデルがすべてのパネル応答を読み取り、合意点・矛盾点・部分的な重複・独自見解・盲点を構造化分析し、その分析に基づいて最終回答を作成します。全ての処理はサーバー側で実行され、体験は単一モデル呼び出しとほぼ同じです。

DRACO基準実測:Fusionは単体モデルを全面的に超越

OpenRouterチームはPerplexity AIのDRACO深度研究基準を用いて評価を行いました。この基準は、10の分野にまたがる100の複雑な研究課題を対象とし、評価項目は事実正確性(約20項目)、広さと深さ(約9項目)、提示品質(約6項目)、引用品質(約5項目)を含み、負の重み付けメカニズムも備え、誤情報を出したモデルはペナルティを受けます。

以下は各構成のスコア結果です:

  • Fusion(Fable 5 + GPT-5.5 → Opus 4.8融合):69.0% 🥇
  • Fusion(Opus 4.8 + GPT-5.5 + Gemini 3.1 Pro → Opus 4.8融合):68.3%
  • Fusion(Opus 4.8 + GPT-5.5 → Opus 4.8融合):67.6%
  • Fusion(Opus 4.8融合自身):65.5%
  • Claude Fable 5 単体:65.3%(ただし、内容フィルターにより93/100問のみ完答)
  • Fusion(Gemini 3 Flash + Kimi K2.6 + DeepSeek V4 Pro → Opus 4.8融合):64.7% 🔥
  • DeepSeek V4 Pro 単体:60.3%
  • GPT-5.5 単体:60.0%
  • Claude Opus 4.8 単体:58.8%

予算パネルでも勝てる:三モデル合体はFableにわずか1%未満差

最も市場を驚かせた結果は、「予算パネル」から得られました。Gemini 3 Flash、Kimi K2.6、DeepSeek V4 Proの3つの比較的安価なモデルをFusion融合させた結果、64.7%のスコアを獲得し、GPT-5.5(60.0%)やOpus 4.8(58.8%)を上回るだけでなく、Claude Fable 5には1%未満差に迫り、コストは後者の半分程度です。これにより、開発者は低コストでありながら高度な研究能力に近い推論を実現できることになります。

もう一つ注目すべき発見は、「自己融合」も有効であることです。Opus 4.8をパネル内の2つの同型モデル(2つのインスタンス)として用い、Judgeも同じモデルのOpus 4.8を使って融合させた場合、スコアは65.5%となり、単一のOpus 4.8(58.8%)より6.7ポイント高くなります。これは、Fusionの効果の一部が合成(synthesis)ステップ自体の価値に由来していることを示しており、同じモデルを2回動かすことで異なる推論経路やツール呼び出し、情報源の選択による顕著な性能向上が得られることを示しています。

FusionはFableの代替品ではないが、適用シーンは明確

OpenRouterのCEO、Alex AtallahはX(旧Twitter)上で、「FusionはFableと同等の知性を持ち、価格は半分」と述べています。ただし、チームはまた、DRACO基準には長期シーケンス(long-horizon)タスクは含まれておらず、これこそClaude Fable 5の真の強みであると認めています。複雑な多段推論や長時間のコンテキストを必要とするタスクにおいては、Fableは短期的には代替不可能です。

また、プログラム開発の場面においても、Fusionは直接的にプログラムモデルの代替策ではありません。OpenRouterはFusionをサーバーツールとして設計しており、基礎モデルが深い研究(アーキテクチャの決定やベストプラクティスの調査など)を必要とする場合に、自動的にFusion呼び出しを判断します。日常的なコード作成は従来通りメインモデルが担当します。

四つの呼び出し方式を一度に理解

開発者は以下の4つの方法でFusionを利用できます:

  • チャットルーム試用:openrouter.ai/fusion にアクセスし、プリセットまたは自作パネルを選択
  • モデルスラッグ指定:API内で "model": "openrouter/fusion" を指定し、デフォルトの最先端パネルを自動適用
  • サーバーツール:tools配列に {"type": "openrouter:fusion"} を追加し、メインモデルが自動的に呼び出し判断
  • プラグインモード:API呼び出しにplugins引数を付与し、パネルモデルの組み合わせをカスタマイズ

Fusionのデフォルトパネルの呼び出しコストはFableの約50%ですが、応答時間は標準呼び出しの2〜3倍(複数モデルの並列推論と融合待ちのため)です。OpenRouterは、ユーザーフィードバックに基づき性能改善を継続するとしています。

この記事はOpenRouter Blogからの転載であり、動区動趨による編集・整理です。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン留め