中国联通提出新フレームワークMeanCache、マルチモーダル生成モデル推論加速のベンチマークを刷新

robot
概要作成中

株式投資は金麒麟アナリストのレポートを見ればよい。権威的で、専門的で、タイムリーで、包括的で、潜在力のあるテーマのチャンスを掘り起こすお手伝いをします!

(出典:マシーン・インテリジェンスPro)

著者およびチームの紹介:本稿の第一著者は高焕霖であり、責任著者は趙放および廉士国で、すべての著者は中国聯通データインテリジェンス有限公司(中国聯通データ科学・人工知能研究院)- 元景大規模モデル開発チームおよび南京大学に所属しており、聯通元景大規模モデル開発に注力しています。

FLUX、Qwen-Image などのマルチモーダル生成モデルの推論速度は、常に実用化の現場でのマルチモーダルモデル導入における痛点です。従来の特徴キャッシュ(Feature Caching)の方式は、高い倍率での高速化を追求する際、瞬間速度の大きな変動により軌跡がずれてしまうことがよくあります。

この課題に対して、中国聯通データ科学・人工知能研究院と南京大学の研究チームは、これまでの作業 LeMiCa(NeurIPS 2025 Spotlight)に基づきさらに深掘りし、発展形の加速フレームワーク MeanCache を発表しました

本研究は、拡散モデルの加速分野におけるチームの深い蓄積を継承するだけでなく、技術的にも飛躍を実現しました。MeanFlow に触発され、MeanCache は初めて「平均速度」の観点をキャッシュ推論に導入し、JVP により生成軌跡を正確に補正して、4x 以上の推論高速化を達成しました。この成果はすでに人工知能のトップ会議 ICLR 2026 に採択されており、現在、論文もコードもともにオープンソース化されています。

技術革新:平均速度駆動のキャッシュ新パラダイム

MeanCache の中核的な貢献は、キャッシュ加速を「瞬間速度」から「平均速度」へと転換した点にあります。主に次の 2 つの中核技術が含まれます:

JVP 駆動の平均速度

このモデリング方式は、キャッシュの観点を単一の「点」から「区間」へと拡張し、より安定した誘導信号を提供することで、高倍率加速における軌跡のずれを効果的に補正します。

軌跡の安定性に基づく調整戦略

「いつキャッシュすべきか?」従来の方法は多くの場合、固定ステップ長や手動の閾値に依存していました。MeanCache は推論プロセスを多重グラフ(Multigraph)の最適化問題としてモデル化します。

それは各タイムステップをノードと見なし、予測平均速度と実値の間の安定性偏差をエッジ重みとして定義します:

ノードとエッジが多重グラフを構成し、その後、ピーク抑制付き最短経路(Peak-Suppressed Shortest Path)アルゴリズムを用いて、計算予算および計算規則の下で最適なキャッシュ戦略を計算します:

実験結果:SOTA の加速性能を更新

画像生成

商用レベルの画像生成モデル Qwen-Image と FLUX.1 [dev] では、それぞれ最大 4x の加速を実現し、Image Reward と知覚指標において SOTA の成果を達成しています。

視覚的な観点からは、加速比が大きくなるにつれて、MeanCache が生成した画像は内容の一貫性においてより良い性能を示しています。

動画生成

動画生成モデル HunyuanVideo でも 3.6x の加速と SOTA 指標の向上を実現しています。

動画に関する定性分析でも、MeanCache はより良い加速効果を示しており、画質であれ内容の一貫性であれ、いずれの面でも優れています。

セマンティクスの一貫性:さらに一歩、rare-word(下の図 “Peristeronic”)のような難度の高い固有のプロンプトを対象にしたテストでは、MeanCache はより強いセマンティクスのロバスト性を示しました。

業界トップチームによる推奨

同時に、MeanCache は最新の Alibaba Tongyi の Z-Image および Qwen-Image-2512 の画像生成モデルをサポートしており、Z-Image チームの公式ホームページからの推薦も得ています。コミュニティでは ComfyUI への対応がすでに進んでいます

まとめと展望

MeanCache は学習不要の軽量化 Flow Matching 加速フレームワークとして、「平均速度キャッシュ」と「軌跡安定性調整」のソリューションを革新的に提案しました。この方式は、画像の高い忠実度と内容の一貫性を確保しつつ、大規模モデルの推論効率を大幅に向上させます。聯通元景大規模モデルチームは、この基盤をもとに、モデル推論加速および複雑なシナリオでの生成分野を継続的に深掘りしていきます。私たちは、業界に向けてより多元的な技術的視点を提供し、さらに産業用の生成モデルの利用のハードルと計算資源コストを下げることに取り組みます。

大量の情報、精密な解説は、Sina Finance APP へ。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • 人気の Gate Fun

    もっと見る
  • 時価総額:$2.23K保有者数:1
    0.00%
  • 時価総額:$2.26K保有者数:2
    0.07%
  • 時価総額:$2.22K保有者数:1
    0.00%
  • 時価総額:$2.23K保有者数:1
    0.00%
  • 時価総額:$2.23K保有者数:0
    0.00%
  • ピン