XiaomiとMiniMaxが同時に大攻勢を仕掛け、エージェントの価格戦争が正式に開始される

robot
概要作成中

3月18日と19日、中国の二つの企業がそれぞれのエージェント向け大規模モデルを発表した。国内のAIスタートアップMiniMaxはM2.7を、シャオミ傘下の大規模モデルチームMiMoはV2-Proをリリースした。両モデルはエージェントベンチマークで世界トップクラスに入りながらも、そのAPI出力の価格設定はClaude Opus 4.6の1/21と1/8である。

同じ週にリリースされたが、手持ちのカードは全く異なる。これらは全く異なる二つの技術路線を代表しており、エージェント時代の二つの未来を賭けている。

同じ試験、学費は1/17

まず最も直感的な比較から。

OpenRouterと各社公式の価格ページのデータによると、API出力価格(百万トークンあたり)で見ると、MiniMaxのM2.7は1.2ドル、MiMo-V2-Proは3ドルである。参考までに、Claude Opus 4.6の出力価格は25ドル、GPT-5.2は14ドル、Claude Sonnet 4.6は15ドルだ。

価格差は桁違いだが、能力差はそうではない。SWE-bench Verified(現在最も主流のコードエンジニアリング能力を測るベンチマーク)では、MiMo-V2-Proが78%、Sonnet 4.6が79.6%で、差はわずか2ポイント未満。M2.7のSWE-Proスコアは56.22%、GPT-5.3-Codexとほぼ同じだ。VIBE-Pro(エンドツーエンドのプロジェクト納品能力評価)では、M2.7は55.6%を記録し、Opus 4.6に近いレベルにある。

この図のポイントは、誰が高いか低いかではない——各社のベンチマーク体系が完全に一致しているわけではないため、直接比較には注意が必要だ。重要なのは、「価格-性能の剪断差」だ:国内製エージェントモデルはすでに同じ能力帯に入りながらも、全く異なる価格帯に位置している。

兆パラメータvs自己進化

価格はあくまで表面上の話だ。両社は全く異なる底牌を見せている。

MiMo-V2-Proは「大力出奇跡」路線を歩む。シャオミ公式の発表によると、V2-Proは総パラメータ数が1兆を超え、活性化パラメータは42B、100万トークンの超長文コンテキストをサポートしている。核心の革新はHybrid Attention(ハイブリッドアテンション)機構で、スライディングウィンドウ注意(SWA)と全局注意(GA)の比率を7:1に調整している——前モデルのV2-Flashは5:1だった。この構造により、長文ドキュメントや複数ツールの並列呼び出しを行うエージェントシナリオでの安定性が向上している。PinchBench(エージェントツール呼び出し能力評価)では、MiMo-V2-Proは84%を獲得した。

一方、M2.7は全く異なる道を歩む。MiniMaxが3月18日に公開した公式技術ブログによると、M2.7のパラメータ数は公開されていないが、「自己反復進化」メカニズムを示している。モデルは自律的に100回以上の最適化ループを実行し、失敗軌跡の分析、修正計画、自身のコードアーキテクチャの変更、評価の実行、再ループを行い、最終的に内部評価セットで30%の性能向上を達成した。MLE Bench Lite(機械学習コンペの難易度評価)の22問の高難度問題では、9金、5銀、1銅を獲得し、平均メダル獲得率は66.6%だった。

五つの側面から見ると、二つの路線の尖り方は全く異なる。MiMo-V2-Proはコンテキスト長とコードエンジニアリングの面で明らかに優位であり、M2.7はオフィス自動化と自己反復能力で差をつけている。MiniMaxの同じ技術ブログによると、M2.7はGDPval-AA(オフィス文書処理評価)でELO1495を獲得し、オープンソースモデルのトップに立ち、40以上の複雑なスキルをカバーするMM-Clawテストでも97%のスキル遵守率を維持している。

五ヶ月で四つのバージョン

両社は技術路線だけでなく、イテレーションのリズムも全く異なる。

公開記録によると、MiniMaxは2025年10月にM2をリリースし、2026年3月にM2.7をリリースするまでの五ヶ月間に四つのバージョンを開発・公開し、平均して約49日に一つのメジャーバージョンを出している。M2.5からM2.7への間隔はわずか約30日だ。

一方、シャオミのMiMoはペースが異なる。2025年4月に7Bパラメータのオープンソース推論モデルMiMo-7Bをリリースし、同年12月にV2-Flash(総パラメータ309B)、2026年3月にV2-Pro(総パラメータ1兆)を公開した。各世代間のパラメータ規模は大きく異なるが、リリース間隔はより長い。

MiniMaxは小さなステップで高速に進む戦略を選び、各イテレーションの規模は小さくても頻度は非常に高い。M2.7の自己反復メカニズムは「継続的進化」を念頭に設計されている。一方、シャオミは一撃必殺の戦略を採用し、各バージョンはパラメータ規模とアーキテクチャの大幅な飛躍を伴う。

匿名8日でOpenRouterトップ

技術路線だけでなく、シャオミのリリース戦略も業界の常識を破っている。

ロイターの報道によると、3月11日にHunter Alphaという匿名モデルが世界最大のAPI集約プラットフォームOpenRouterに登場した。ブランドの後ろ盾もなく、記者会見もなく、技術ブログもない。API価格は非常に低いが、その性能は驚くほど高い。

コミュニティはその出自を推測し始めた。Republic Worldや複数のテックメディアによると、最も有力な推測はDeepSeek V4で、MiMoチームのリーダーである羅福莉は以前DeepSeekで研究を行っていたためだ。呼び出し回数は急増し、匿名期間中の総呼び出しは1兆トークンを突破し、OpenRouterの週間トップに立った。

3月19日未明、シャオミが明らかにしたところによると、Hunter Alphaは実はMiMo-V2-Proだった。ロイターの同じ報道によると、発表後、シャオミの香港株は一時5.8%上昇した。

これは国内大規模モデルが、純粋なブラインドテストだけで自らを証明した初めてのケースだ。ブランドや宣伝に頼らず、わずか8日間で開発者の「足で投票」させたのである。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン留め