DeepSeek V4爆発の背後:シリコンバレーは「壁を作り」、中国は「道を整備している」

null

文 | Alter

4月24日上午、遅れて登場したDeepSeek V4がついに真の姿を現した。

その日、DeepSeek-V4-ProはHugging Faceのオープンソースモデルランキングのトップに立ち、二つの「核弾頭級の革新」が話題になった。

一つは、百万級の超長文コンテキストだが、KVキャッシュはV3.2の10%しかなく、アマゾンのエンジニアからHBM不足問題を解決すると絶賛された。

二つ目は、中国製チップへの適応で、開発過程で華為と密接に協力し、昇腾や寒武紀などの国产チップへの最速の適応を実現した。

偶然にも、Hugging Faceのオープンソースモデルランキングで二位に位置するのは、4月20日深夜にリリース・オープンソース化されたKimi K2.6だった。

太平洋の向こう側では、二つの兆億パラメータモデルの「衝突」が、評価やビジネスの覇権争いのために激しく争われることは避けられないが、国内では全く異なる光景が繰り広げられている。互いの過去を暴露し合うドラマも、公関戦の暗闘もなく、むしろ技術の基盤で「交代防衛」が行われている。

「異常」と見える背後には、中米のAI技術路線の違いが潜んでいる。シリコンバレーは狂ったように「高い壁」を築き、クローズドソースで既得権益を守ろうとしているのに対し、国内の大規模モデルメーカーは「壁を壊す」選択をし、オープンソースの土壌の上で協調進化を進めている。

01 シリコンバレーは「権力ゲーム」に陥る

国内の大規模モデルの多様なオープンソース路線とは異なり、OpenAI、Anthropic、GoogleのGeminiを代表とするシリコンバレーのAIリーダーたちは、すべてクローズドソースの支持者だ。

最先端の技術革新は各自のデータセンターに閉じ込められ、計算能力コストの重圧と資本市場の期待に直面し、「シリコンバレー精神」として知られるオープンと協力は次第に消えつつあり、プレイヤーたちは避けられないゼロサムの「権力ゲーム」に巻き込まれている。

過去2年で、技術の「暗闘」は公開の喧嘩に進化し、最も典型的な手段は互いに「風頭を奪い合う」ことだ。競合他社が新製品をリリースする重要なタイミングで、自社の重厚なアップデートを迅速に投入し、相手の声量を抑えるのがシリコンバレーの常套手段となっている。

2024年5月には、OpenAIとGoogleが同時にAI新製品を発表し、一方はGPT-4oが世界をリードするとし、もう一方はGeminiファミリーが全エコシステムと全ルートをカバーできると主張した。結局、両社のCEOは我慢できず、ソーシャルメディア上で互いを嘲笑し合った。

Googleとの「絡み合い」だけでなく、OpenAIとAnthropicの対決も白熱化している。4月16日、Anthropicは新モデルのClaude Opus 4.7をリリースした直後、OpenAIは2時間余りでCodexを大幅にアップデートし、「Codex for(almost) everything)」というスローガンを掲げた。時間の衝突は偶然ではなく、OpenAIがAnthropicを狙った狙撃のための巧妙な計画だったと誰もが見抜いている。

世論の「文斗」に加え、互いに「過去を暴露」し合う「武闘」もシリコンバレーの常態となっている。

Anthropicは4月7日に年収300億ドルに達したと大々的に発表し、OpenAIの250億ドルを超えた。

一週間後、OpenAIの最高収益責任者は社員向けの内部メールで、Anthropicの宣伝する300億ドルの年収には深刻な水増しがあると指摘した。これは「総額法」を採用し、AmazonやGoogleなどのクラウドサービス提供者への手数料も全額計上しているため、実際の年収は約80億ドル過少評価されているという。

この内部告発は、テック業界では珍しく、投資家に対して「Anthropicの成長神話は水増しだ」と伝える狙いだ。

敵意が生まれると、あらゆる決定に影響を及ぼす。

Anthropicは、安全条項を含む契約を削除しようとしたことで五角大楼と揉めた後、数時間でOpenAIは米国国防総省と協力関係を結んだと大々的に発表した。

2026年の「スーパーボウル」では、Anthropicは高額な広告を出し、「広告はAI分野に進出しているが、Claudeには入らない」と内容を伝えた。これは、広告機能のテストを始めたばかりのOpenAIに対して「顔を突きつける」ような挑発だった。

なぜかつての「同門兄弟」が水火の仲になったのか?

その根底には、クローズドソースの商業モデルの本質的な論理がある。クローズドソースの生存基盤は、競争優位のための堀を築くことにあり、その前提は技術の拡散を阻止し、最先端の生産力を独占することだ。さらに、技術路線の不整合や製品の対立も自然にナッシュ均衡を形成し、「停戦」する者のブランドストーリーが崩壊し、内紛の泥沼に深く沈む。

02 オープンソース陣営の「協調進化」

国内に目を向けると、シナリオは全く異なる。

1年以上前、DeepSeek-R1の登場は、大規模モデルのスタートアップ競争にブレーキをかけ、決勝進出の「六小虎」たちに影響を与えた。シリコンバレー最大の違いは、DeepSeekが池のすべての魚を飲み込む「サメ」ではなく、ナマズのように中国の大規模モデルエコシステムを活性化し、皆がオープンソースを受け入れたことだ。

直接的な例は、DeepSeekの成長軌跡と高度に重なる「月の暗面」だ。2023年に始まったスタートアップチームで、少人数ながら高い人材密度を持ち、Scaling Lawの信奉者だ。

2025年7月、「月の暗面」は世界初の兆億パラメータのオープンソースモデルKimi K2をリリースし、技術報告書でDeepSeekのMLAアーキテクチャを採用したことを明言した。大規模モデルにとって最大の悪夢は、超長文処理のためのメモリ壁だが、MLAの革新はKVキャッシュの圧縮率を驚異の93%以上にしたことだ。

DeepSeekの「業界標準」により、「月の暗面」などの大規模モデルチームは、再発明を避け、推論コストを大幅に削減できた。

しかし、物語はこれで終わらない。

DeepSeek V4の技術ドキュメントを見ると、モデルのアーキテクチャの詳細が記されており、その一つの重要なアップグレードは、多くのモジュールのオプティマイザをAdamWからMuonに変更し、収束速度の向上と訓練の安定性を実現したことだ。

Kimi K2.6の技術ドキュメントでも、Muonオプティマイザに言及し、同じ訓練量で2倍の効率向上を達成している。

このMuonオプティマイザは、最も早く2024年末に研究者のKeller Jordanによるブログで提案された。同じAdamWの問題に悩まされた「月の暗面」チームは、2025年初頭にMuonのエンジニアリング改良を行い、Weight DecayやRMS制御などの機能を追加し、「MuonClip」と名付けた。

「月の暗面」はKimi K2でMuonの安定性を最初に検証し、事前学習全期間で「ゼロLoss Spike」を実現した。DeepSeekもV4の大規模モデル訓練で、同じく検証済みのMuonオプティマイザを採用している。

なお、オープンソースの大規模モデルの「協調進化」は、同質化に陥ることなく、「和而不同」の道を歩んでいる。

例えば、DeepSeek-V4は基盤モデルのコア能力の強化に焦点を当て、世界のオープンソース大規模モデルの性能の天井をさらに高め、業界全体にクローズドフラッグシップに匹敵する性能基盤を提供している。一方、Kimi K2.6はエージェントのエンジニアリング実装に注力し、大規模モデルの長距離自主実行の課題を解決し、実運用シナリオへの道を開いている。

この過程で、長期的な商談や特許戦争はなく、オープンソースの技術革新は水のように自由に流れ、優れたものは皆が使う。

オープンソースエコシステムから栄養を吸収し、技術路線を補完し合う。中国の大規模モデルメーカーは、行動を通じてシリコンバレー以外のもう一つの可能性を世界に示している。

03 米国は「壁を作り」、中国は「道を整備」

オープンソースの協調進化を称賛しつつも、ビジネスの現実に直面しなければならない。

現在、OpenAIとAnthropicの年収はともに百億ドル超だが、国内のトップクラスの大規模モデルメーカーの収益は、やっと年収1億ドルの門を越えたところだ。

OpenAIの二次市場での評価額は約8800億ドル、Anthropicの評価額は1兆ドルに迫り、KimiやDeepSeekの新たな資金調達の評価額はそれぞれ180億ドルと200億ドルだ。

中国の大規模モデルメーカーの時価総額は過小評価されているとの声もあり、「技術の評判を現金に変えることができるか」が中国メーカーの生死を分ける大きな試練だと考える人もいる。こうした中、オープンソースの「コストパフォーマンス」についての議論が盛んになっている。

最終的な結末を見極めるには、大規模モデルの競争段階から考えるのが良い。

第一段階は「パラメータとベンチマークの勝負」。2026年4月末にはこの段階はほぼ終了し、各社のランキングスコアの差は実質的に縮まっている。

第二段階は「訓練効率と推論コスト、アーキテクチャ革新の勝負」。これは今の段階であり、計算コストの高騰に伴う必然の結果だ。

第三段階は「エージェント体系とエコシステム、開発者の勝負」。トークンが無料流量からタスク実行の「燃料」へと変わるとき、エコシステムの繁栄度が生死を左右する。

国内のオープンソース大規模モデルはどのエコシステムに位置しているのか?二つの直感的な比較データを見つけた。

一つは訓練コスト。

2025年8月にリリースされたGPT-5の訓練コストは5億ドル超。一方、同時期のKimi K2 Thinkingは約460万ドル。DeepSeekはV4シリーズの訓練コストを公表していないが、V3モデルはわずか557.6万ドルだった……国内の大規模モデルメーカーは、OpenAIの資源のほんの一部で、同等のモデルを訓練している。

もう一つは呼び出し量。

2026年以降、多モデル統合プラットフォームのOpenRouterのデータによると、OpenClawを代表とするエージェント製品の牽引で、世界のトークン消費量は指数関数的に増加している。中国の「オープンソース夢のチーム」は、「使いやすくて安い」という評判を背景に、呼び出し量が米国を連続して上回っている。

理由は簡単だ。

中国のオープンソース陣営は、「正のフィードバック・フライホイール」をすでに回している。A社が基盤技術をオープン化し、B社が採用・エンジニアリング最適化を行い、その結果と経験をエコシステム全体に還元する。クローズドモデルの進化は大量の計算能力に支えられた線形成長だが、オープンソースの道は、技術革新の相互衝突による指数関数的な拡散をもたらす。

モルガン・スタンレーのレポートによると、2025-2030年の中国のAI推論トークン消費量は約330%の年複合成長率を実現し、2025年の10兆トークンから2030年には3900兆トークンに激増し、成長規模は370倍に達する。

つまり、2026年はAI爆発の初期段階にあり、今後5年間で数百倍の成長の可能性があり、結論を出すには早すぎる。

長期的なチャンスへの自信こそが、シリコンバレーの巨頭たちが壁を築く中、中国の大規模モデルメーカーは協調を通じて道を切り開き続けている。

04 最後に

この激動のAIブームで、最後に笑うのは誰か?答えはモデルだけでなく、計算能力の自主制御にも関わる。モデルを「原子爆弾」に例えるなら、外部の技術封鎖を突破した国産の計算能力は、まさに原子爆弾を空に送る「ロケット」だ。

喜ばしいことに、国産モデルと国産計算能力の融合はますます密接になっている。DeepSeek V4の技術ドキュメントでは、昇腾NPUとNVIDIA GPUがハードウェア検証リストに並列して記載されている。月の暗面は最新の論文で、大規模モデルの推論の事前充填とデコード処理を異なるチップ上で行い、国産チップの大規模なモデル推論参加の扉を開いた。

2025年初頭、DeepSeek R1は国産大規模モデルの上場の機会を獲得した。2026年には、中国のオープンソース大規模モデルエコシステムは、協調と連携の中で、より多くの規則を定義するハード資本を次々に創造している。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン