DeepSeek V4 発表後数日、シリコンバレーでは長引く議論が続き、いくつかのより鋭い問題提起も生まれた:モデルの効率性、チップの格局、IPOのタイミング、オープンソースとクローズドソースの圧力。
4月29日、シリコンバレー101の動画ブログにて、チップアーキテクトの肖志斌と元OpenAI研究員のジェニー・シャオが、1時間以上にわたりこの件を徹底的に語り尽くした。
対談の中で最も厳しい一言は、ジェニーが去年提起した概念——kill line(死亡線)、オープンソースモデルがクローズドモデル企業に引く死亡線。
"If you're a foundation model company and you get surpassed by open source, the value of your business is essentially zero." もしあなたが基盤モデル企業で、オープンソースに追い越されたら、あなたのビジネスの価値は実質ゼロになる。
"If you're a foundation model company and you get surpassed by open source, the value of your business is essentially zero."
もしあなたが基盤モデル企業で、オープンソースに追い越されたら、あなたのビジネスの価値は実質ゼロになる。
これは技術競争ではなく、生死の境界線だ。
ジェニーはAnthropicの例を挙げた:もしある日、Claudeがもはや最良のプログラミングモデルでなくなったら、誰がClaude Codeを使うだろうか?
この論理に沿えば、4月24日にDeepSeek V4がリリースされたことで、シリコンバレーのすべてのクローズド企業の株価と評価額は、まさに魂の問いに直面している:あなたのモデルは、今の価格で売る価値があるのか?
価格で最も直感的に語ると:
GPT-5.5はGPT-5.4よりちょうど2倍高価で、長文Pro版は1百万トークンあたり180ドル。
同じ日にDeepSeek V4がリリースされた。入力は1元/百万トークン、出力は24元/百万トークン。Flash版はさらに過激で、入力は0.2元/百万トークン、出力は2元/百万トークン。
一つは2倍高く、もう一つは10倍安い。
基盤モデル企業の評価は二元的だ——あなたの存在理由はモデルの最強さにある。一度最強でなくなれば、評価は即座にゼロになる。 たとえOpenAIと呼ばれても。
ジェニーは対談の中で、シリコンバレーが直面しないふりをしてきた真実を突きつけた:
"シリコンバレーの企業は資金が多すぎて、効率化の動機付けが逆に弱い。中国のモデルメーカーはリソースに追われ、早期にトークン効率性の革新に取り組んでいる。"
リソース制約が、逆に革新の加速装置となる。
OpenAIは最初から「move fast, break things」を信奉し、GPUを自由に買い、インフラを狂ったように構築した。一方、Anthropicは抑制的で、収益が追いつかないことを恐れ、調達コストに引きずられている。
結果はどうか?同じ収益の下で、Anthropicの資本効率はOpenAIよりも著しく高い。
さらに厄介なのは、OpenAIはハードウェア部門、自社チップ、ショッピングアプリなど複数の戦線を同時に展開し、コアのChatGPT体験は十分に仕上がっていないことだ。昨年末から副次的なプロジェクトを次々と切り捨て、Soraもその一つだ。
投資家の心境は完全に変わった。以前はAI企業を「曲線は指数関数的に伸びている、投資を続けるべきだ」と見ていたが、今や問うのは:
"さらに10億、100億を投資したら、どんな辺境の利益が得られるのか?ROIはどこにあるのか?"
DeepSeekの答えは非常にストレートだ:インフラのROIを追求し続けるのは、もはや割に合わないかもしれない。
革新は追い詰められて生まれる。安さそのものが、技術革命の前提条件だ。
産業革命ごとに、推進力は単に技術の優秀さだけでなく、そのコストの安さにもある。普通の人が使えるほど安くなれば、技術は本当に世界を変える。
肖志斌はV4の論文を読んで、「方向性は予想通りだが、完成度は意外だった」と述べた。
V4のすべての技術最適化は、ひとつの標的——トークン効率性(詞元効率)——に向かっている。
彼は三つの切り札を使った:
• Muon最適化器:一部の訓練モジュールを従来のAdamから置き換え、収束速度をさらに向上させる。
これら三つの施策は、同じ結果を指している:各トークンの生成コストが低減し、推論時のメモリ使用量も少なくなる。
計算コストはシリコンバレーのモデルの1/3にまで削減され、メモリ占有も1/10に抑えられた。
しかし、V4が本当に恐ろしいのは、「省コスト」だけではなく、もっと深いところにある。
ジェニーは対談の中で繰り返し指摘した:チャットボット時代は、トークン消費が限定的で、モデルのコストが少し高くてもユーザーは我慢できる。しかしエージェント時代は全く別のロジックだ——長期タスクの分解、多ツール呼び出し、反復的な反省と計画、これらはトークン消費がチャットの10倍から100倍になる。
もしトークン一つ一つに高いコストがかかると、モデルは長時間の深い思考や、大規模なユーザーサービスができなくなる。
だから彼女はあの決定的な言葉を投げかけた:
効率がなければ、AGIはただのデモに過ぎない。効率があれば、AGIは真のプロダクトになり得る。
エージェント時代において、効率性そのものが知性の一部となる。
この間、Anthropicの評価額はOpenAIを逆転し、1兆ドルに到達した。
ジェニーはその理由を三つ挙げたが、根本は五文字——集中力 > 何でもやること。
第一、Claude Code。
なぜClaude CodeがAnthropicの「決定的瞬間」なのか?
Anthropicのモデルは常に優秀だったが、Claude Codeこそが実際に収益を牽引する製品だ。OpenClawの創始者ピーター・スタインバーガーは、次のような記事を書いた:《Claude Codeは私のコンピュータだ》。
モデルがコードを書けるようになれば、汎用的なタスクもこなせる——CRMの更新、メールの転送、自動化フローの構築、すべてコードが基盤だ。
ジェニーの見立ては鋭い:プログラミングはAGIへの最も重要な一歩だ。プログラミングを制した者が、AGI時代の主導権を握る可能性が高い。
第二、企業の信頼。
ジェニーのファンドに所属する企業顧客は繰り返し同じことを言う:選ぶのはAnthropic、なぜなら安全性の約束があるからだ。さらに、Anthropicが五角大山を訴えた件もあり、企業はそのメッセージを受け入れている。
第三、無駄なことはしない。
OpenAIは「すべての人のすべてのもの」を目指したが、戦線が散漫になり、技術的リードを失った。Anthropicは三つの線に絞る:安全性、企業向け、プログラミング。
シリコンバレーの投資家は一つの死に至る理屈を信じている:企業の収益優先、消費者収益は二の次。 Anthropicの収益は企業に集中しており、これこそ米国資本市場が最も好むストーリーだ。
チップについて言えば、今やDeepSeekは「NVIDIAからの脱却」を進めていると感じられる。
しかし実際は、もっと細分化されている。
訓練段階:DeepSeek V4の巨大な事前訓練は、間違いなくNVIDIAのクラスター上で行われた。V4の英語技術レポートの16ページ、20ページに記載のTCGenO5や、MegaMoE²などの重要演算子は、CUDAエコシステムに深く結びついた底層最適化だ。
**適応段階:**華為の昇腾は「0-day適応と継続訓練/推論」を謳い、AMDは「ROCm上での最適化統合」をアピール。
ここで重要なのは、「適応」という言葉だ。
これは、モデルがすでにNVIDIAクラスター上で訓練・定着していることを意味する。昇腾やAMDは、その訓練済みモデルに対して、自社のソフトウェアスタックを用いて「後付け」するだけだ。これは後方互換性であり、ネイティブな置き換えではない。
この観点から見れば、短期的にはNVIDIAの訓練面の堀はかなり深い。CUDAエコシステムは一、二年で移行できるものではない。
しかし長期的には?推論市場は確かに動き始めている。
V4が長文のattentionコストを削減したことで、大規模推論のハードルは大きく下がった。推論はもはや「誰が多くのGPUを持つか」ではなく、「誰のアーキテクチャが合うか」の勝負になりつつある。Google TPU、AMD、自社開発チップ、さらには国産の計算力も、この流れの中でチャンスを狙っている。
ジェニーの投資ポートフォリオには一つのデータがある:80%のタスクは中小規模のオープンソースモデルで処理されている。残りの20%の最も複雑なタスクだけがクローズドモデルを使う。
一年前には、この比率を誰も信じなかった。
今やシリコンバレーでは毎日のようにこうした情報が流れる:「私たちの手元には1000万ドルのOpenAI株がある。あなたのファンドは買うのか?誰か買っているのか?」
4月29日のシリコンバレー101の最後に、ジェニーは一言でこの件に決着をつけた。
"DeepSeekはシリコンバレーのモデル企業の背後に銃を突きつけている。これらの企業がスピードを上げなければ、DeepSeekは追いつき、彼らのビジネスを根絶するだろう。"
この銃はすでに装填されている。
195.56K 人気度
36.36K 人気度
67.01K 人気度
490.69K 人気度
3.83M 人気度
DeepSeekこの銃はすでにシリコンバレーの後頭部に突きつけられている
DeepSeek V4 発表後数日、シリコンバレーでは長引く議論が続き、いくつかのより鋭い問題提起も生まれた:モデルの効率性、チップの格局、IPOのタイミング、オープンソースとクローズドソースの圧力。
4月29日、シリコンバレー101の動画ブログにて、チップアーキテクトの肖志斌と元OpenAI研究員のジェニー・シャオが、1時間以上にわたりこの件を徹底的に語り尽くした。
オープンソースに超越されると、あなたの商業価値はゼロになる
対談の中で最も厳しい一言は、ジェニーが去年提起した概念——kill line(死亡線)、オープンソースモデルがクローズドモデル企業に引く死亡線。
これは技術競争ではなく、生死の境界線だ。
ジェニーはAnthropicの例を挙げた:もしある日、Claudeがもはや最良のプログラミングモデルでなくなったら、誰がClaude Codeを使うだろうか?
この論理に沿えば、4月24日にDeepSeek V4がリリースされたことで、シリコンバレーのすべてのクローズド企業の株価と評価額は、まさに魂の問いに直面している:あなたのモデルは、今の価格で売る価値があるのか?
価格で最も直感的に語ると:
GPT-5.5はGPT-5.4よりちょうど2倍高価で、長文Pro版は1百万トークンあたり180ドル。
同じ日にDeepSeek V4がリリースされた。入力は1元/百万トークン、出力は24元/百万トークン。Flash版はさらに過激で、入力は0.2元/百万トークン、出力は2元/百万トークン。
一つは2倍高く、もう一つは10倍安い。
基盤モデル企業の評価は二元的だ——あなたの存在理由はモデルの最強さにある。一度最強でなくなれば、評価は即座にゼロになる。 たとえOpenAIと呼ばれても。
資金が多すぎて、逆に節約できない
ジェニーは対談の中で、シリコンバレーが直面しないふりをしてきた真実を突きつけた:
"シリコンバレーの企業は資金が多すぎて、効率化の動機付けが逆に弱い。中国のモデルメーカーはリソースに追われ、早期にトークン効率性の革新に取り組んでいる。"
リソース制約が、逆に革新の加速装置となる。
OpenAIは最初から「move fast, break things」を信奉し、GPUを自由に買い、インフラを狂ったように構築した。一方、Anthropicは抑制的で、収益が追いつかないことを恐れ、調達コストに引きずられている。
結果はどうか?同じ収益の下で、Anthropicの資本効率はOpenAIよりも著しく高い。
さらに厄介なのは、OpenAIはハードウェア部門、自社チップ、ショッピングアプリなど複数の戦線を同時に展開し、コアのChatGPT体験は十分に仕上がっていないことだ。昨年末から副次的なプロジェクトを次々と切り捨て、Soraもその一つだ。
投資家の心境は完全に変わった。以前はAI企業を「曲線は指数関数的に伸びている、投資を続けるべきだ」と見ていたが、今や問うのは:
"さらに10億、100億を投資したら、どんな辺境の利益が得られるのか?ROIはどこにあるのか?"
DeepSeekの答えは非常にストレートだ:インフラのROIを追求し続けるのは、もはや割に合わないかもしれない。
革新は追い詰められて生まれる。安さそのものが、技術革命の前提条件だ。
産業革命ごとに、推進力は単に技術の優秀さだけでなく、そのコストの安さにもある。普通の人が使えるほど安くなれば、技術は本当に世界を変える。
効率がなければ、AGIはただのデモに過ぎない
肖志斌はV4の論文を読んで、「方向性は予想通りだが、完成度は意外だった」と述べた。
V4のすべての技術最適化は、ひとつの標的——トークン効率性(詞元効率)——に向かっている。
彼は三つの切り札を使った:
• Muon最適化器:一部の訓練モジュールを従来のAdamから置き換え、収束速度をさらに向上させる。
これら三つの施策は、同じ結果を指している:各トークンの生成コストが低減し、推論時のメモリ使用量も少なくなる。
計算コストはシリコンバレーのモデルの1/3にまで削減され、メモリ占有も1/10に抑えられた。
しかし、V4が本当に恐ろしいのは、「省コスト」だけではなく、もっと深いところにある。
ジェニーは対談の中で繰り返し指摘した:チャットボット時代は、トークン消費が限定的で、モデルのコストが少し高くてもユーザーは我慢できる。しかしエージェント時代は全く別のロジックだ——長期タスクの分解、多ツール呼び出し、反復的な反省と計画、これらはトークン消費がチャットの10倍から100倍になる。
もしトークン一つ一つに高いコストがかかると、モデルは長時間の深い思考や、大規模なユーザーサービスができなくなる。
だから彼女はあの決定的な言葉を投げかけた:
効率がなければ、AGIはただのデモに過ぎない。効率があれば、AGIは真のプロダクトになり得る。
エージェント時代において、効率性そのものが知性の一部となる。
Anthropicがなぜ1兆ドル超えに反超できたのか?集中力 > 何でもやる
この間、Anthropicの評価額はOpenAIを逆転し、1兆ドルに到達した。
ジェニーはその理由を三つ挙げたが、根本は五文字——集中力 > 何でもやること。
第一、Claude Code。
なぜClaude CodeがAnthropicの「決定的瞬間」なのか?
Anthropicのモデルは常に優秀だったが、Claude Codeこそが実際に収益を牽引する製品だ。OpenClawの創始者ピーター・スタインバーガーは、次のような記事を書いた:《Claude Codeは私のコンピュータだ》。
モデルがコードを書けるようになれば、汎用的なタスクもこなせる——CRMの更新、メールの転送、自動化フローの構築、すべてコードが基盤だ。
ジェニーの見立ては鋭い:プログラミングはAGIへの最も重要な一歩だ。プログラミングを制した者が、AGI時代の主導権を握る可能性が高い。
第二、企業の信頼。
ジェニーのファンドに所属する企業顧客は繰り返し同じことを言う:選ぶのはAnthropic、なぜなら安全性の約束があるからだ。さらに、Anthropicが五角大山を訴えた件もあり、企業はそのメッセージを受け入れている。
第三、無駄なことはしない。
OpenAIは「すべての人のすべてのもの」を目指したが、戦線が散漫になり、技術的リードを失った。Anthropicは三つの線に絞る:安全性、企業向け、プログラミング。
シリコンバレーの投資家は一つの死に至る理屈を信じている:企業の収益優先、消費者収益は二の次。 Anthropicの収益は企業に集中しており、これこそ米国資本市場が最も好むストーリーだ。
NVIDIA:短期的な安全性、長期的な推論市場の必然的な分化
チップについて言えば、今やDeepSeekは「NVIDIAからの脱却」を進めていると感じられる。
しかし実際は、もっと細分化されている。
訓練段階:DeepSeek V4の巨大な事前訓練は、間違いなくNVIDIAのクラスター上で行われた。V4の英語技術レポートの16ページ、20ページに記載のTCGenO5や、MegaMoE²などの重要演算子は、CUDAエコシステムに深く結びついた底層最適化だ。
**適応段階:**華為の昇腾は「0-day適応と継続訓練/推論」を謳い、AMDは「ROCm上での最適化統合」をアピール。
ここで重要なのは、「適応」という言葉だ。
これは、モデルがすでにNVIDIAクラスター上で訓練・定着していることを意味する。昇腾やAMDは、その訓練済みモデルに対して、自社のソフトウェアスタックを用いて「後付け」するだけだ。これは後方互換性であり、ネイティブな置き換えではない。
この観点から見れば、短期的にはNVIDIAの訓練面の堀はかなり深い。CUDAエコシステムは一、二年で移行できるものではない。
しかし長期的には?推論市場は確かに動き始めている。
V4が長文のattentionコストを削減したことで、大規模推論のハードルは大きく下がった。推論はもはや「誰が多くのGPUを持つか」ではなく、「誰のアーキテクチャが合うか」の勝負になりつつある。Google TPU、AMD、自社開発チップ、さらには国産の計算力も、この流れの中でチャンスを狙っている。
硅谷を眠らせる「80/20」信号
ジェニーの投資ポートフォリオには一つのデータがある:80%のタスクは中小規模のオープンソースモデルで処理されている。残りの20%の最も複雑なタスクだけがクローズドモデルを使う。
一年前には、この比率を誰も信じなかった。
今やシリコンバレーでは毎日のようにこうした情報が流れる:「私たちの手元には1000万ドルのOpenAI株がある。あなたのファンドは買うのか?誰か買っているのか?」
4月29日のシリコンバレー101の最後に、ジェニーは一言でこの件に決着をつけた。
"DeepSeekはシリコンバレーのモデル企業の背後に銃を突きつけている。これらの企業がスピードを上げなければ、DeepSeekは追いつき、彼らのビジネスを根絶するだろう。"
この銃はすでに装填されている。