原文タイトル:「AI半導体終局推演 2026(II)」 原文著者:fin、AIアナリスト
半導体が構造的にAI推論の主流へと進化するにつれ、メモリとストレージが最大のボトルネックとなり、市場がメモリとストレージに抱く最大の疑問は以下の通りだ:
HBM/DRAM/SSDは従来の周期性から脱却できるのか?
HBMの指数関数的成長に依存するGPUアーキテクチャの進化路線は止まるのか?いつ止まるのか?
長鑫の増産の影響はどの程度か?この市場を再び周期の泥沼に引きずり込むのか?
本稿ではこれらの問題を整理するための枠組みを構築してみる
万物は周期であり、メモリの周期性は特に強い。その最大の要因は、増産サイクルが長すぎること、迅速な増産ができないこと、そして需要不足の時期とのミスマッチにある
従来の周期性から脱却するためのいくつかの方法
カスタマイズ化:製品に互換性がなく、生産能力を簡単に転用できず、長期契約が必要。
構造的な指数関数的需要増加:需要曲線自体が非常に急峻で、供給が常に追いつかない。
技術革新の急速な進化:各世代の製品が急速に前世代を陳腐化させる。
これらのいずれかを満たせば、従来の周期から部分的に脱却できる。2~3つを満たせば、大部分の従来周期から脱却できる
この枠組みに照らすと、HBMは3つのうち約2.5つを満たしている
HBMには確かにカスタマイズとNvidiaのコードサインの要素があるが、それほど強くはない。本当にカスタマイズされているのはパッケージングとベースダイのみであり、その上の十数層のDRAMダイは完全にJEDEC標準化されている。
例えば、SamsungのHBM3EがNVIDIAの認定に合格せず、市場シェアが約60%から20%まで落ち込んだとき、同社はこの生産能力を抱え込んで廃棄するのではなく、すぐにGoogleのTPUやAMDに回した。物理的には、NVIDIA向けのHBM3EとAMD向けのHBM3Eは同じものだ。したがって生産能力は依然として部分的に自由に移転可能である。
HBM4以降はさらにカスタマイズが進み、ベースダイにカスタムロジックや/またはキャッシュを統合する。より複雑な方法としては、HBM4Eのメモリコントローラとカスタムダイ間インターフェースをロジックベースダイに直接組み込む方法がある
SemiAnalysisによると、OpenAI、NVIDIA、AMDはそれぞれカスタムHBMの開発を行っているが、これはベースダイのカスタマイズを指しており、その上のDRAM層は依然として標準品である。
部分的なカスタマイズ特性により、HBMは主にパッケージングでの協力が必要であり、これが顧客に長期契約を強いる結果にもなっているが、生産能力は確かに移転可能であるため、HBMはかろうじて0.5つと数えられる。
最も直感的な理由は、Nvidiaのトークンファクトリーのトークンスループット向上のためのハードウェアアップグレード需要により、HBM帯域幅の世代交代が極めて速く、HBMサイズの需要が指数関数的に増加していることだ
この点は、前回の「AI半導体終局推演2026(I)」の結論でもある:
トークンスループット = HBMサイズ × HBM帯域幅、毎世代倍増。
GPUあたりのHBMサイズは年間約40%以上増加している
この需要曲線の急峻さは、DRAM供給側の14%のウェーハ増加と9%の密度向上では追いつきにくい
ハードウェア分野では、attnフェーズにおけるKVキャッシュの極めて高い帯域幅とメモリサイズ要求により、HBMは独特の地位を占めている。たとえHBMの価格が3~5倍に上昇しても、HBMに資金を投じることで得られる限界トークンスループットの向上は、他の分野に投じるよりもはるかに費用対効果が高い。
他のメモリ技術(SRAM、HBF、CXL、PIM)は、現在HBMの主力分野であるKVキャッシュ/アテンションにおいて正面から競争できておらず、少なくとも今後5年、あるいはそれ以上は代替技術が見つかる可能性は低い
DDR3の時代は15年続いたが、現在はまだDDR5の時代である。一方、HBMの世代交代速度は基本的に2年に1世代であり、従来のDDRに比べてはるかに速く、最近では加速傾向にある。HBMサイズ×HBM帯域幅は毎世代倍増しており、現在この法則に完全に従っている
2年ごとのHBM世代交代により、NV GPUの速度は指数関数的に上昇している:2TB/s -> 3.5TB/s -> 4.8TB/s -> 8TB/s -> 22TB/s。また、HBMの速度と推論トークンスループットは完全に線形比例するため、前世代のHBMの限界使用コストは割に合わなくなり、誰もが可能な限り最新の製品を使おうとする。より高価ではあるが、それによって得られる利益(トークンスループット)はより大きいからだ
トークンファクトリー時代の論理は、技術革新(HBM帯域幅)を多く行うほど、より多くの利益を得られるというものだ
この速度差により、CPUと同様の状況が生まれている:旧製品の価値が急速に低下するため、在庫を抱える価値が低くなっている。例えば、HBM3の価値は非常に急速に低下しており、今日では主流製品ではほとんど使用されていない
そのため、HBMメーカーの合理的な選択は、現在の生産能力で市場を占める競争(数量競争)から、安定性とHBM速度における技術競争、次世代NVIDIAプラットフォームでの認定シェア競争(品質競争)へと移行し、従来の周期の下降局面において、誰も減産して市場シェアを失いたくないという囚人のジレンマを回避している。
HBMと従来のDRAMを比較すると、3つの条件のうち2.5つを満たしている。では、HBMは従来の周期性から脱却できるのか?
メモリ周期性の源は、主流の見解では、DRAMにはコモディティ特性(差別化なし → 価格競争 → 在庫の貯蔵可能)があるため周期性があるとされている。
しかし、コモディティ特性自体は周期を生み出すのではなく、振幅を増幅させるだけである
特にDRAM分野では、かつて囚人のジレンマが発生し、下降局面でSamsungが増産して市場シェアを奪い、先に減産した者が損をするという状況が生まれ、誰も簡単に減産できず、最終的には全員が大きな損失を被った
実際には、周期性の主な構造的要因は供給サイクルが長すぎることであり、需要サイクルとミスマッチが生じやすい。ファブ建設には3年かかり、数百億ドルの投資が必要で、一度決定すれば不可逆的である。一方、需要の増加は不安定であり、クラウドサービス、モバイルインターネット、パンデミック時のオンライン需要など、新しいパラダイムの成長が起こるたびに爆発的な増加が見られるが、2年経つと成長が鈍化し、供給が需要を上回り、価格が急落して損失サイクルに陥る
万物は周期であり、HBMもこの点は避けられない。しかし、トークン需要が依然として指数関数的に成長している限り、構造的な指数関数的成長が周期性を弱める。なぜなら需要の予測可能性が高まり、価格が下がれば顧客はHBMサイズを増やす(トークンスループットを増やす)需要が生じ、さらにHBMにはカスタマイズ要件があるため長期契約が中心となり、周期性から成長周期性へと転換し、このサイクルは特に長くなるからだ
・周期性:上昇局面で多く儲け、下降局面で多く損する ・成長周期性:上昇局面で多く儲け、下降局面でも儲けは少ないが損はしない
さらに、HBM/DRAMには、従来の周期から脱却する3つの条件に加えて、もう一つの重要な優位性がある:
2000年頃、DRAMのウェーハ当たりのDRAMビット密度は年間約45%増加していた。つまり、ウェーハ枚数を増やさなくても、年間のDRAMビット供給量は45%増加していたことになる
10年前、DRAMビットの年間密度増加率は20%に低下し、現在では9%にまで低下している。以前はDRAMの増産は新たな工場を建設しなくても年間20~30%のビットボリューム増加が可能だったが、現在ではDRAMの増産は主にウェーハ枚数の増加、つまり新工場やクリーンルームの建設に依存している。
HBMの急速な増産を困難にするもう一つの理由は、HBM3eには約3倍のDRAMウェーハが必要であり、HBM4では積層密度の増加により約4倍のDRAMウェーハが必要となることだ。つまり、HBMビットはDRAMビットに比べて常に製造が難しくなっており、単位DRAMウェーハ当たりの製造可能なHBMビット数は減少しており、これはデフレを意味する
HBMは将来、成長周期性から従来の周期性に戻る可能性があるのか?最も重要な要素は構造的な指数関数的成長である。では、
AI推論時代において、HBMの指数関数的成長に依存するGPUアーキテクチャの進化路線は止まるのか?いつ止まるのか?
トークンスループット = HBMサイズ × HBM帯域幅、このHBM指数関数的成長の第一原理におけるHBMサイズの成長要因はまさにKVキャッシュの成長である。KVキャッシュの特性とアテンションの特性は、HBMに非常によく適合している。さらには、HBMを他の技術よりも優位にし、KVキャッシュとアテンションフェーズの利用率を最大化できる。
言い換えれば、もしKVキャッシュがアーキテクチャ上で存在しなくなれば、HBMサイズの指数関数的成長のロジックも挑戦を受けることになる
したがって、この問題の本質は、Transformerに代表されるアテンション機構と、そこから派生したKVキャッシュ機構が消滅するのか?退潮後に取って代わられるのか?ということだ
歴史的な法則から見ると:AIモデルアーキテクチャの革命が起こるたびに、本当に残るのは数学的に何らかの普遍性を持つプリミティブな操作である
例を挙げると:FFN(フィードフォワードネットワーク、モデル内の多数のMLP層)は2012年のディープラーニング時代の産物だが、現在の大規模言語モデルに至るまで生き残り、依然としてモデルのかなりのパラメータ数を占めている。なぜ生き残ったのか?これも普遍近似定理(Universal Approximation Theorem)によるものである:十分に幅の広いMLPは任意の連続関数を近似できる
アテンションもおそらく、このように残るプリミティブの一つだろう。なぜなら、それは同様に基本的な問題を解決するからだ:シーケンス内の任意の2つの位置間の動的ルーティング(Dynamic Routing)。シーケンス内の任意の2つの位置が必要に応じて関係を構築できるようにする。この能力が有効であると確認されれば、捨てるのは難しい
したがって、将来のアーキテクチャが純粋なTransformerからハイブリッドアーキテクチャへ、あるいはワールドモデルへと進化しても、アテンション層は依然として存在し、KVキャッシュ(あるいはその潜在的な圧縮後の等価物)は依然として必要であり、HBMは引き続き推論の核心の一つであり続ける。このHBMの指数関数的成長に依存するGPU KVキャッシュアーキテクチャの進化路線は止まらない
HBMが周期性から脱却することについては市場である程度のコンセンサスがあるが、DRAMが周期性から脱却することについては、市場は現在ほとんどコンセンサスを得ていない
再び先ほどの枠組みに戻る。従来の周期から脱却する3つの条件のうち、DRAMにはカスタマイズ化がない。したがって、技術革新の速度だけを見ることになるが、最も重要なのは構造的な指数関数的成長があるかどうかだ。答えはイエスである
AIトークンファクトリーの概念では、構造的な指数関数的成長は確かに主にHBMに当てはまる。しかし、2025年末以降に状況は変化した:エージェンティックCPUがその潜在力を解放し始めるにつれ、CPUに付随するDRAM需要が、DRAMの新たな構造的な指数関数的成長の源泉になりつつある
この部分の成長ロジックは2つのレベルに分けられる:第一層はCPUサーバーのTAM(総アドレス可能市場)の急速な成長、第二層はエージェンティックフローの急速な成長により、サーバーCPUコアあたりに搭載されるDRAM容量の急速な増加である
サーバーCPU TAMの急速な成長の4つのロジックについては、4月のCPU特集で詳しく述べた。簡単に言うと:
AIアクセラレータークラスターにおけるCPUとGPUの比率が、従来の1:4から1:2、さらには1:1に向かって進んでいる
エージェンティックフローではCPU処理の遅延比率が高く(50~90%)、重要なボトルネックとなっており、同時に拡張が必要
AIコーディングによりSDEの効率が大幅に向上し、コード量が桁違いに増加し、ソフトウェアAPIコールが指数関数的に増加し、これが直接CPU時間の指数関数的な増加につながっている
サンドボックスはデータの安全性と分離を確保するため、例えばAnalytical Agentはタスクごとに大量のデータベースとユーザーコンテキストを複製する必要があり、メモリ(DRAM)とCPUコアの深刻な浪費を引き起こす。この浪費問題は5年あるいはそれ以上解決できない。また、CPU時間は技術的に最適化によってデフレ化することが難しい
これが、前々四半期にAMDの決算でCPU TAMが2030年までに600億ドルに達すると発表され、2ヶ月前にはAMD/ARMが2030年のCPU TAM予測を1200億ドルに倍増し、1ヶ月前にはNvidiaが再び2030年のCPU TAM予測を2000億ドルに倍増した理由である
そして先週、Bernsteinは2030年のCPU TAM見通しをさらに2230億ドルに引き上げた。私の見解では、2031年のCPU TAMが将来4000億ドルに上方修正されることはほぼ確実であり、唯一の疑問は、どの大手企業がいつこの見通しの上方修正を発表するかである
第二層、なぜエージェント時代にサーバーCPUコアあたりのDRAM使用量が急速に増加するのか?
従来のWeb/SaaSはステートレスである:リクエストが来て、メモリを割り当て、処理が終わればすぐにメモリを解放する。一方、エージェントタスクは1分から1時間かかることもあり、その間ずっと、メッセージ履歴、システムプロンプト、作業記憶、長期記憶、ツール結果のバッファがすべてDRAMに常駐する
CPU時間と同様に、各タスクのメモリフットプリントは、状態を持つこととサンドボックス分離(各タスクがデータベースとコンテキストを複製する)の要件により、技術的に圧縮することが難しい
コンテキストウィンドウは32K → 256K → 1Mと拡大し、推論/テスト時計算のシーケンス長は爆発的に増加しており、今後も増え続ける。各アクティブセッションに常駐するメッセージはコンテキスト長に比例して線形に増加する
では、この2つのレベルを掛け合わせてみよう。
第一層、CPUサーバーのTAMは、2030~2031年までに約5~7倍の規模になる(600億 → 1200億 → 2000億 → 2230億、私はさらに4000億に達すると考えている)
第二層、CPUあたりのDRAM搭載量は約3~4倍(コアあたり4~8GB → 16~32GB)だが、この増加は主に一過性のメリットである可能性が高い
2030年、仮に保守的にCPU TAMを3000億ドル、1CPUコアを50ドルとし、エージェント時代の最も保守的な16GB/コアとすると、新規需要は最低でも96EBとなる。一方、今年のDRAM総生産量はわずか47EB、来年は辛うじて60EBであり、これは驚くべき増加量である
このエージェンティックCPUによるDRAMの指数関数的成長は、第二層では大部分が一過性のメリットであるが、その持続期間は非常に長くなると予想される。なぜなら、この不足のギャップがあまりにも大きいからだ
冒頭の枠組みに戻ろう。従来の周期から脱却する3つの条件のうち、第一条のDRAMカスタマイズ化はほぼ無視できる
第二条:構造的で指数関数的な、しかも反転が難しい需要源が成立している。コモディティDRAMも今や部分的に従来の周期性から脱却する資格を有している。HBM(2.5つ)ほど徹底してはいないが、実質的な変化である
第三条、技術革新の速度についても、DRAMのテンポは以前とは異なっている
なぜなら、以前のDRAM技術革新の速度はコンシューマーエレクトロニクスに大きく依存しており、DDRの進歩がパフォーマンスに与える影響は小さかった。しかし、予見可能な将来において、カーボンベースのコンシューマー向け従来型DRAMの使用量は、シリコンベースのコンシューマー(CPUサーバー)向けDRAMの使用量をはるかに下回るだろう
以前はDRAMの速度向上による限界効用は非常に低かったが、現在ではCPUサーバーのメモリ需要の増加や、エッジAIによるDDR速度要求の増加(例えばAppleがローカル大規模モデルを実行するためにLPDDR速度を高速化)により、速度向上の限界効用はかなり高まっている
そのため、DDR6とLPDDR6の速度向上に対する需要は以前よりもはるかに大きくなっている。図でもわかるように、LPDDR6/DDR6の世代交代時間は短縮され、速度の傾きは再び上昇し始めている
以前は、新しい世代のDDR/LPDDR技術が登場しても、反応は冷ややかで、価格が下がってから使用するのが普通だった
しかし現在、LPDDR6が登場すると、各社はできるだけ早く採用しようと躍起になっている。速度向上によるパフォーマンス向上が手に取るようにわかるからだ
さらに、DDRの供給はHBMによって追加で税を課されている。HBMの増産ペースが速すぎるため、毎年、本来コモディティDDRに使用できたウェーハの一部がHBMに引き抜かれる。HBMの変換比は非常に低く、HBM3Eは同等のビットを生産するのに約3枚のDDRウェーハの生産能力が必要であり、HBM4では4枚必要である。したがって、毎年約3%から5%のDDRビット増加は、このHBMビット税によって直接消費される
そのため、DRAMビットボリュームは将来的に年間約24%増加する(14%はウェーハ増加、9%はウェーハあたりのDRAM密度向上)が、HBMビット税を考慮すると、従来型で非HBMのコモディティDDRの年間ビット成長率は約20%にとどまる(ウェーハ増加約10%×ノード密度向上約9%)
中国の長鑫の増産の影響はどの程度か?もし無秩序に増産を続ければ、この市場を再び周期の泥沼に引きずり込むのか?
長鑫のここ数年の増産ペースは依然として速く、2025年は月20万ウェーハだが、2026年には北京のウェーハ工場と新たな生産ラインの寄与により32~35万ウェーハに達する見込みである。
建設中の上海工場の第1期は2027年までに月10万ウェーハの生産能力を追加、第2期は2028年までに月10万ウェーハの生産能力を追加する見込みである。つまり、2027年には月42万ウェーハ、2028年には月50万ウェーハに達する可能性がある。
ただし注意すべき点として、長鑫のDRAMビット密度は御三家(Samsung、SK Hynix、Micron)の約半分であるため、長鑫の月50万ウェーハから生産できるDRAMビットボリュームは他社の半分に過ぎない。ここでの月間ウェーハ数(WPM)の計算は、等価で半分として計算する
この割引を適用すると、長鑫がDRAM業界全体に与える影響はかなり小さくなる。2025年末から2028年末までに、長鑫がDRAMビット生産能力のCAGRに与える影響は約1.5%に過ぎず、業界全体のDRAM生産能力のCAGRは約12.7%から14.2%に上昇する程度である
・DRAM月間生産能力 (kwspm) 2025E → 2028E CAGR ・Samsung 685K → 920K 10.3% ・SK Hynix 519K → 725K 11.8% ・Micron 340K → 560K 18.1% ・中国以外のその他 150K → 218K 13.3% ・中国 (密度半減) 117K → 274K 32.8% ・中国を含む合計 1811K → 2697K 14.2% ・中国を除く合計 1694K → 2423K 12.7%
たとえ長鑫が今後も増産ペースを維持したとしても、2030年に業界全体の等価生産能力に対する年間DRAMビットボリューム増加CAGRへの影響は約3%未満であり、CAGRが20%から23%になる程度である。
さらに、長鑫は露光装置に制約を受けており、DDR6はより高速(14400 MT/s以上)と高密度を必要とする。御三家はDDR6に1c以降のより先進的なノード(約12nm以下)を使用する可能性が高く、すでにEUVを全面的に使用している。長鑫はDDR6の速度に制約を受け、密度も半分にとどまる可能性がある。
第一の理由は、先ほど述べたCPUサーバー需要側の巨大な成長による構造的なDRAM需要の指数関数的成長である。ここでDRAM供給側のビットボリュームCAGRが約20%で安定していることを考慮すると、DRAMの今後数年のギャップがなぜ拡大し続けるのかが明確に見える:
非HBMの従来型DRAMの供給側は年間約20%増加する。一方、需要側は、2026年に600億ドルのCPU TAM、CPUあたり平均8GB/コアのDRAM消費、コアあたり30~35ドルと仮定すると、需要は16EBとなる。
2030年に4000億ドルのCPU TAM、CPUあたり平均16GB/コアのDRAM消費、コアあたり80ドル(CPU価格は2倍以上上昇)と仮定すると、需要は80EBとなる。このDRAM需要の成長CAGRは約50%であり、現在の推定値をはるかに上回る。
HBMがトークンスループットに直接結びつき、GPUの収益効率に直結するのとは異なり、DRAM不足がエージェントフローに与える影響は主に速度である。例えば、8GB/コアと16GB/コアを比較すると、一部のワークロードでは速度が30%低下する可能性がある。一部の価値の低いタスクは待つこともできる。構造的な指数関数的成長の動機は非常に強いが、需要はGPUほど硬直的ではない。
Semianalysisによると、今年のDRAMのギャップは一桁台のパーセンテージ、来年は10%を超えるとしている。エージェントCPUの急増によるDRAMの構造的状況から見ると、このギャップは毎年拡大し続け、2030年までは減少する可能性は低い。
DRAMが長期にわたって強い状態を維持できるもう一つのロジックは、DRAMの値上げによって消滅した需要の一部は実際には消えたのではなく、単に遅延しているだけであり、需要の貯水池が多すぎることである。
いわゆる貯水池とは、「メモリ価格が下がればすぐに解放される潜在需要」のことである。これらが存在するということは、たとえ供給が一時的に追いついても、価格が暴落しにくいことを意味する。なぜなら、常に貯水池から新しい需要が湧き出て買い支えるからだ:
メモリの計算能力/速度の貯水池:
本来は追加のメモリによって速度と計算力を最適化する必要がある需要が大量に存在し、メモリが高すぎる間は抑制されているが、メモリ価格が下がれば解放される。
例えば、NvidiaのCPXプリフィルアクセラレーションは、本来は追加の低コストGDDR7を使用して専用のプリフィルアクセラレーターを構築する設計だったが、LPDDR/GDDRが高すぎて(値上げ前のHBMよりも高い)、この方式のROIが合わなくなった。しかし、通常のメモリ価格が下落すれば、CPXのような最適化方式は再び戻ってくるだろう。
低価値タスクの貯水池:メモリ価格上昇によりトークン価格が高止まりすると、高価値タスクが優先され、低価値タスクは延期される。メモリ価格が下がれば、延期されていた需要は戻ってくる。
エッジAIの貯水池:AI PCのメモリ構成は24GBから128GBまで上昇する可能性がある。Appleはすでに最新のエッジAIフルバージョンに8GBから12GBへのメモリアップグレードを要求している。
通常のコンシューマーエレクトロニクス、エージェントPC、低価格帯スマートフォンなど、メモリ価格上昇によって減少した需要はすべて貯水池である。
これほど多くの貯水池が積み重なることで、極めて厚い需要の緩衝材が形成される。これが、今回のDDRの構造的成長が市場の想定よりも持続力を持つ理由である。
DRAM価格が大幅に下落しにくいもう一つの理由は、HBMとDRAMの生産能力が相互に変換可能であるため、DRAMコンプレックス全体が一緒にre-rateされることである。
上昇局面ではDRAMの利益率がHBMをはるかに上回り、HBMの値上げ幅はむしろDRAMによって推進される。今年新たに契約されたHBM4の価格は、当期のDRAM価格×4、つまり通常の積層倍率に対応するHBM4の価格である。
一度DRAMの価格が下落して利益率が低下すると、HBMの長期契約の透明性により利益率は保証されているため、HBMは間接的にDRAMの生産能力をさらに引き抜くことになる。また、HBMの価格下落はGPUメーカーが可能な限りHBMサイズをアップグレードする動機を強め、これも間接的にDRAMの価格下限を保証することになる。
DRAMには構造的な指数関数的需要の増加があり、密度スケーリングの鈍化により増産の難易度が増しており、メーカーの増産計画は慎重であり、長鑫の影響もここ数年は限定的であり、さらに需要の貯水池が非常に大きい。これら4つの理由により、少なくとも今後5年以上、DRAMが景気循環の谷に入ることは困難である。
NANDの構造的成長の原動力はDDRほど強くない。今年の品不足の主な理由は、主要プレーヤー数社の生産規律が良好に維持されており、大規模な増産を行っていないこと、毎年の生産能力増加は主に技術改良(NAND積層数の増加)によるものである。
最初の構造的成長はAIによるもので、主にKVキャッシュのオフローディングであり、HBMからあふれたウォーム/コールドKVキャッシュをNAND SSDにオフロードするものだ。
しかし驚くべきことに、このKVキャッシュオフローディングの成長はまだ大規模には発生していないにもかかわらず、SSDはすでにDRAMよりも深刻な品不足となっており、値上げ幅もDRAMを上回っている。来年にRubin CMXが出荷され、KVキャッシュオフローディングが本格的に適用されるようになれば、SSDの品不足はこの構造的成長によってさらに拡大するだろう。
第二に、昨年の年間総括で言及した将来有望なAIビデオによる構造的増加分は、今年すでに注目を集める状況になっている。
Seedanceのボリュームは年10倍から40倍のペースで成長している。現在、まだGPU不足に悩まされており、需要は計算能力によって抑制されて完全には解放されていない。しかし、GPU不足の段階が過ぎれば、AIビデオによるNANDストレージの構造的需要成長は、かなり長期間続くだろう。
第三の構造的成長も、エージェントフローによるサンドボックス使用量の指数関数的増加に由来する。サンドボックスはデータの安全性と分離を確保するため、例えばAnalytical Agentはタスクごとに大量のデータベースとユーザーコンテキストを複製する必要があり、メモリ(DRAM)とCPUコアの深刻な浪費を引き起こすとともに、大量のSSDの浪費(需要)ももたらす。
第四の構造的成長は、おそらく2030年以降に効果を発揮するもので、HBF技術がSSDを必要とすることに由来する。多くの投資銀行分析で期待されているが、この技術はまだ遠い未来のものであり、主な役割は大規模モデルの重みを格納すること、一度重みを書き込んで読み取り専用とすることであり、さらにGPU/HBMとパッケージングされる必要がある(48TBps/96TBps)。そうでなければ、PCIE7/8では速度が遅すぎて全く使用できない。将来が期待されるが、次回の「AI半導体終局推演2026(III)」でより詳細な分析を行う予定である。
要するに、NAND SSDの構造的成長はHBMほど強力ではないが、安価であることが強みであり、2027年でも価格はわずか0.8ドル/GBで、同期のDRAMの40分の1である。そのため、マルチレベルキャッシュにおける何でも屋的な特性を持ち、構造的成長の源泉が非常に幅広い。
つまり、DRAM/HBMだけが値上がりで好況となる一方で、SSDが値上がりしないという状況は存在しない。なぜなら、もしそのような状況が発生すれば、誰もがSSDを使用してDRAM/HBMの一部の機能を代替しようとし、より低コストで同様の効果を実現しようとするからだ。HBM、DRAM、NANDは独立した3つの物語ではなく、同じAIメモリ階層における異なる温度帯での構造的成長である。
構造的な指数関数的需要の増加があるとして、NAND SSDは周期から脱却したのか?そのためには、NAND SSDメーカーの生産規律に依存する。唯一生産規律を守らない可能性があるのは長存(YMTC)である。これは囚人のジレンマであり、一社が無秩序に増産を始めれば、NAND業界全体の増産難易度はDRAMよりもはるかに低い。
しかし最低限、今回のNANDもスーパーサイクルであり、いくつかの構造的な指数関数的成長による需要により、下降局面は2030年まで問題なく遅延できるだろう。
原文リンク
クリックして律動BlockBeatsの募集中のポジションを確認
律動 BlockBeats の公式コミュニティへようこそ:
Telegram 購読グループ:https://t.me/theblockbeats
Telegram 交流グループ:https://t.me/BlockBeats_App
Twitter 公式アカウント:https://twitter.com/BlockBeatsAsia
1.62M 人気度
346.43K 人気度
64.58K 人気度
362.78K 人気度
595.46K 人気度
AI半導体の終局推測:不足は少なくともあと5年続くのか?
半導体が構造的にAI推論の主流へと進化するにつれ、メモリとストレージが最大のボトルネックとなり、市場がメモリとストレージに抱く最大の疑問は以下の通りだ:
HBM/DRAM/SSDは従来の周期性から脱却できるのか?
HBMの指数関数的成長に依存するGPUアーキテクチャの進化路線は止まるのか?いつ止まるのか?
長鑫の増産の影響はどの程度か?この市場を再び周期の泥沼に引きずり込むのか?
本稿ではこれらの問題を整理するための枠組みを構築してみる
万物は周期であり、メモリの周期性は特に強い。その最大の要因は、増産サイクルが長すぎること、迅速な増産ができないこと、そして需要不足の時期とのミスマッチにある
従来の周期性から脱却するためのいくつかの方法
カスタマイズ化:製品に互換性がなく、生産能力を簡単に転用できず、長期契約が必要。
構造的な指数関数的需要増加:需要曲線自体が非常に急峻で、供給が常に追いつかない。
技術革新の急速な進化:各世代の製品が急速に前世代を陳腐化させる。
これらのいずれかを満たせば、従来の周期から部分的に脱却できる。2~3つを満たせば、大部分の従来周期から脱却できる
この枠組みに照らすと、HBMは3つのうち約2.5つを満たしている
HBMには確かにカスタマイズとNvidiaのコードサインの要素があるが、それほど強くはない。本当にカスタマイズされているのはパッケージングとベースダイのみであり、その上の十数層のDRAMダイは完全にJEDEC標準化されている。
例えば、SamsungのHBM3EがNVIDIAの認定に合格せず、市場シェアが約60%から20%まで落ち込んだとき、同社はこの生産能力を抱え込んで廃棄するのではなく、すぐにGoogleのTPUやAMDに回した。物理的には、NVIDIA向けのHBM3EとAMD向けのHBM3Eは同じものだ。したがって生産能力は依然として部分的に自由に移転可能である。
HBM4以降はさらにカスタマイズが進み、ベースダイにカスタムロジックや/またはキャッシュを統合する。より複雑な方法としては、HBM4Eのメモリコントローラとカスタムダイ間インターフェースをロジックベースダイに直接組み込む方法がある
SemiAnalysisによると、OpenAI、NVIDIA、AMDはそれぞれカスタムHBMの開発を行っているが、これはベースダイのカスタマイズを指しており、その上のDRAM層は依然として標準品である。
部分的なカスタマイズ特性により、HBMは主にパッケージングでの協力が必要であり、これが顧客に長期契約を強いる結果にもなっているが、生産能力は確かに移転可能であるため、HBMはかろうじて0.5つと数えられる。
最も直感的な理由は、Nvidiaのトークンファクトリーのトークンスループット向上のためのハードウェアアップグレード需要により、HBM帯域幅の世代交代が極めて速く、HBMサイズの需要が指数関数的に増加していることだ
この点は、前回の「AI半導体終局推演2026(I)」の結論でもある:
トークンスループット = HBMサイズ × HBM帯域幅、毎世代倍増。
GPUあたりのHBMサイズは年間約40%以上増加している
この需要曲線の急峻さは、DRAM供給側の14%のウェーハ増加と9%の密度向上では追いつきにくい
ハードウェア分野では、attnフェーズにおけるKVキャッシュの極めて高い帯域幅とメモリサイズ要求により、HBMは独特の地位を占めている。たとえHBMの価格が3~5倍に上昇しても、HBMに資金を投じることで得られる限界トークンスループットの向上は、他の分野に投じるよりもはるかに費用対効果が高い。
他のメモリ技術(SRAM、HBF、CXL、PIM)は、現在HBMの主力分野であるKVキャッシュ/アテンションにおいて正面から競争できておらず、少なくとも今後5年、あるいはそれ以上は代替技術が見つかる可能性は低い
DDR3の時代は15年続いたが、現在はまだDDR5の時代である。一方、HBMの世代交代速度は基本的に2年に1世代であり、従来のDDRに比べてはるかに速く、最近では加速傾向にある。HBMサイズ×HBM帯域幅は毎世代倍増しており、現在この法則に完全に従っている
2年ごとのHBM世代交代により、NV GPUの速度は指数関数的に上昇している:2TB/s -> 3.5TB/s -> 4.8TB/s -> 8TB/s -> 22TB/s。また、HBMの速度と推論トークンスループットは完全に線形比例するため、前世代のHBMの限界使用コストは割に合わなくなり、誰もが可能な限り最新の製品を使おうとする。より高価ではあるが、それによって得られる利益(トークンスループット)はより大きいからだ
トークンファクトリー時代の論理は、技術革新(HBM帯域幅)を多く行うほど、より多くの利益を得られるというものだ
この速度差により、CPUと同様の状況が生まれている:旧製品の価値が急速に低下するため、在庫を抱える価値が低くなっている。例えば、HBM3の価値は非常に急速に低下しており、今日では主流製品ではほとんど使用されていない
そのため、HBMメーカーの合理的な選択は、現在の生産能力で市場を占める競争(数量競争)から、安定性とHBM速度における技術競争、次世代NVIDIAプラットフォームでの認定シェア競争(品質競争)へと移行し、従来の周期の下降局面において、誰も減産して市場シェアを失いたくないという囚人のジレンマを回避している。
HBMと従来のDRAMを比較すると、3つの条件のうち2.5つを満たしている。では、HBMは従来の周期性から脱却できるのか?
メモリ周期性の源は、主流の見解では、DRAMにはコモディティ特性(差別化なし → 価格競争 → 在庫の貯蔵可能)があるため周期性があるとされている。
しかし、コモディティ特性自体は周期を生み出すのではなく、振幅を増幅させるだけである
特にDRAM分野では、かつて囚人のジレンマが発生し、下降局面でSamsungが増産して市場シェアを奪い、先に減産した者が損をするという状況が生まれ、誰も簡単に減産できず、最終的には全員が大きな損失を被った
実際には、周期性の主な構造的要因は供給サイクルが長すぎることであり、需要サイクルとミスマッチが生じやすい。ファブ建設には3年かかり、数百億ドルの投資が必要で、一度決定すれば不可逆的である。一方、需要の増加は不安定であり、クラウドサービス、モバイルインターネット、パンデミック時のオンライン需要など、新しいパラダイムの成長が起こるたびに爆発的な増加が見られるが、2年経つと成長が鈍化し、供給が需要を上回り、価格が急落して損失サイクルに陥る
万物は周期であり、HBMもこの点は避けられない。しかし、トークン需要が依然として指数関数的に成長している限り、構造的な指数関数的成長が周期性を弱める。なぜなら需要の予測可能性が高まり、価格が下がれば顧客はHBMサイズを増やす(トークンスループットを増やす)需要が生じ、さらにHBMにはカスタマイズ要件があるため長期契約が中心となり、周期性から成長周期性へと転換し、このサイクルは特に長くなるからだ
・周期性:上昇局面で多く儲け、下降局面で多く損する ・成長周期性:上昇局面で多く儲け、下降局面でも儲けは少ないが損はしない
さらに、HBM/DRAMには、従来の周期から脱却する3つの条件に加えて、もう一つの重要な優位性がある:
2000年頃、DRAMのウェーハ当たりのDRAMビット密度は年間約45%増加していた。つまり、ウェーハ枚数を増やさなくても、年間のDRAMビット供給量は45%増加していたことになる
10年前、DRAMビットの年間密度増加率は20%に低下し、現在では9%にまで低下している。以前はDRAMの増産は新たな工場を建設しなくても年間20~30%のビットボリューム増加が可能だったが、現在ではDRAMの増産は主にウェーハ枚数の増加、つまり新工場やクリーンルームの建設に依存している。
HBMの急速な増産を困難にするもう一つの理由は、HBM3eには約3倍のDRAMウェーハが必要であり、HBM4では積層密度の増加により約4倍のDRAMウェーハが必要となることだ。つまり、HBMビットはDRAMビットに比べて常に製造が難しくなっており、単位DRAMウェーハ当たりの製造可能なHBMビット数は減少しており、これはデフレを意味する
HBMは将来、成長周期性から従来の周期性に戻る可能性があるのか?最も重要な要素は構造的な指数関数的成長である。では、
AI推論時代において、HBMの指数関数的成長に依存するGPUアーキテクチャの進化路線は止まるのか?いつ止まるのか?
トークンスループット = HBMサイズ × HBM帯域幅、このHBM指数関数的成長の第一原理におけるHBMサイズの成長要因はまさにKVキャッシュの成長である。KVキャッシュの特性とアテンションの特性は、HBMに非常によく適合している。さらには、HBMを他の技術よりも優位にし、KVキャッシュとアテンションフェーズの利用率を最大化できる。
言い換えれば、もしKVキャッシュがアーキテクチャ上で存在しなくなれば、HBMサイズの指数関数的成長のロジックも挑戦を受けることになる
したがって、この問題の本質は、Transformerに代表されるアテンション機構と、そこから派生したKVキャッシュ機構が消滅するのか?退潮後に取って代わられるのか?ということだ
歴史的な法則から見ると:AIモデルアーキテクチャの革命が起こるたびに、本当に残るのは数学的に何らかの普遍性を持つプリミティブな操作である
例を挙げると:FFN(フィードフォワードネットワーク、モデル内の多数のMLP層)は2012年のディープラーニング時代の産物だが、現在の大規模言語モデルに至るまで生き残り、依然としてモデルのかなりのパラメータ数を占めている。なぜ生き残ったのか?これも普遍近似定理(Universal Approximation Theorem)によるものである:十分に幅の広いMLPは任意の連続関数を近似できる
アテンションもおそらく、このように残るプリミティブの一つだろう。なぜなら、それは同様に基本的な問題を解決するからだ:シーケンス内の任意の2つの位置間の動的ルーティング(Dynamic Routing)。シーケンス内の任意の2つの位置が必要に応じて関係を構築できるようにする。この能力が有効であると確認されれば、捨てるのは難しい
したがって、将来のアーキテクチャが純粋なTransformerからハイブリッドアーキテクチャへ、あるいはワールドモデルへと進化しても、アテンション層は依然として存在し、KVキャッシュ(あるいはその潜在的な圧縮後の等価物)は依然として必要であり、HBMは引き続き推論の核心の一つであり続ける。このHBMの指数関数的成長に依存するGPU KVキャッシュアーキテクチャの進化路線は止まらない
では、DRAMはどうか?将来、従来の周期性から脱却する可能性はあるのか?
HBMが周期性から脱却することについては市場である程度のコンセンサスがあるが、DRAMが周期性から脱却することについては、市場は現在ほとんどコンセンサスを得ていない
再び先ほどの枠組みに戻る。従来の周期から脱却する3つの条件のうち、DRAMにはカスタマイズ化がない。したがって、技術革新の速度だけを見ることになるが、最も重要なのは構造的な指数関数的成長があるかどうかだ。答えはイエスである
AIトークンファクトリーの概念では、構造的な指数関数的成長は確かに主にHBMに当てはまる。しかし、2025年末以降に状況は変化した:エージェンティックCPUがその潜在力を解放し始めるにつれ、CPUに付随するDRAM需要が、DRAMの新たな構造的な指数関数的成長の源泉になりつつある
この部分の成長ロジックは2つのレベルに分けられる:第一層はCPUサーバーのTAM(総アドレス可能市場)の急速な成長、第二層はエージェンティックフローの急速な成長により、サーバーCPUコアあたりに搭載されるDRAM容量の急速な増加である
サーバーCPU TAMの急速な成長の4つのロジックについては、4月のCPU特集で詳しく述べた。簡単に言うと:
AIアクセラレータークラスターにおけるCPUとGPUの比率が、従来の1:4から1:2、さらには1:1に向かって進んでいる
エージェンティックフローではCPU処理の遅延比率が高く(50~90%)、重要なボトルネックとなっており、同時に拡張が必要
AIコーディングによりSDEの効率が大幅に向上し、コード量が桁違いに増加し、ソフトウェアAPIコールが指数関数的に増加し、これが直接CPU時間の指数関数的な増加につながっている
サンドボックスはデータの安全性と分離を確保するため、例えばAnalytical Agentはタスクごとに大量のデータベースとユーザーコンテキストを複製する必要があり、メモリ(DRAM)とCPUコアの深刻な浪費を引き起こす。この浪費問題は5年あるいはそれ以上解決できない。また、CPU時間は技術的に最適化によってデフレ化することが難しい
これが、前々四半期にAMDの決算でCPU TAMが2030年までに600億ドルに達すると発表され、2ヶ月前にはAMD/ARMが2030年のCPU TAM予測を1200億ドルに倍増し、1ヶ月前にはNvidiaが再び2030年のCPU TAM予測を2000億ドルに倍増した理由である
そして先週、Bernsteinは2030年のCPU TAM見通しをさらに2230億ドルに引き上げた。私の見解では、2031年のCPU TAMが将来4000億ドルに上方修正されることはほぼ確実であり、唯一の疑問は、どの大手企業がいつこの見通しの上方修正を発表するかである
第二層、なぜエージェント時代にサーバーCPUコアあたりのDRAM使用量が急速に増加するのか?
従来のWeb/SaaSはステートレスである:リクエストが来て、メモリを割り当て、処理が終わればすぐにメモリを解放する。一方、エージェントタスクは1分から1時間かかることもあり、その間ずっと、メッセージ履歴、システムプロンプト、作業記憶、長期記憶、ツール結果のバッファがすべてDRAMに常駐する
CPU時間と同様に、各タスクのメモリフットプリントは、状態を持つこととサンドボックス分離(各タスクがデータベースとコンテキストを複製する)の要件により、技術的に圧縮することが難しい
コンテキストウィンドウは32K → 256K → 1Mと拡大し、推論/テスト時計算のシーケンス長は爆発的に増加しており、今後も増え続ける。各アクティブセッションに常駐するメッセージはコンテキスト長に比例して線形に増加する
では、この2つのレベルを掛け合わせてみよう。
第一層、CPUサーバーのTAMは、2030~2031年までに約5~7倍の規模になる(600億 → 1200億 → 2000億 → 2230億、私はさらに4000億に達すると考えている)
第二層、CPUあたりのDRAM搭載量は約3~4倍(コアあたり4~8GB → 16~32GB)だが、この増加は主に一過性のメリットである可能性が高い
2つの独立変数を掛け合わせると、サーバー側のDRAM需要は桁違いの増加となる
2030年、仮に保守的にCPU TAMを3000億ドル、1CPUコアを50ドルとし、エージェント時代の最も保守的な16GB/コアとすると、新規需要は最低でも96EBとなる。一方、今年のDRAM総生産量はわずか47EB、来年は辛うじて60EBであり、これは驚くべき増加量である
このエージェンティックCPUによるDRAMの指数関数的成長は、第二層では大部分が一過性のメリットであるが、その持続期間は非常に長くなると予想される。なぜなら、この不足のギャップがあまりにも大きいからだ
冒頭の枠組みに戻ろう。従来の周期から脱却する3つの条件のうち、第一条のDRAMカスタマイズ化はほぼ無視できる
第二条:構造的で指数関数的な、しかも反転が難しい需要源が成立している。コモディティDRAMも今や部分的に従来の周期性から脱却する資格を有している。HBM(2.5つ)ほど徹底してはいないが、実質的な変化である
第三条、技術革新の速度についても、DRAMのテンポは以前とは異なっている
なぜなら、以前のDRAM技術革新の速度はコンシューマーエレクトロニクスに大きく依存しており、DDRの進歩がパフォーマンスに与える影響は小さかった。しかし、予見可能な将来において、カーボンベースのコンシューマー向け従来型DRAMの使用量は、シリコンベースのコンシューマー(CPUサーバー)向けDRAMの使用量をはるかに下回るだろう
以前はDRAMの速度向上による限界効用は非常に低かったが、現在ではCPUサーバーのメモリ需要の増加や、エッジAIによるDDR速度要求の増加(例えばAppleがローカル大規模モデルを実行するためにLPDDR速度を高速化)により、速度向上の限界効用はかなり高まっている
そのため、DDR6とLPDDR6の速度向上に対する需要は以前よりもはるかに大きくなっている。図でもわかるように、LPDDR6/DDR6の世代交代時間は短縮され、速度の傾きは再び上昇し始めている
以前は、新しい世代のDDR/LPDDR技術が登場しても、反応は冷ややかで、価格が下がってから使用するのが普通だった
しかし現在、LPDDR6が登場すると、各社はできるだけ早く採用しようと躍起になっている。速度向上によるパフォーマンス向上が手に取るようにわかるからだ
さらに、DDRの供給はHBMによって追加で税を課されている。HBMの増産ペースが速すぎるため、毎年、本来コモディティDDRに使用できたウェーハの一部がHBMに引き抜かれる。HBMの変換比は非常に低く、HBM3Eは同等のビットを生産するのに約3枚のDDRウェーハの生産能力が必要であり、HBM4では4枚必要である。したがって、毎年約3%から5%のDDRビット増加は、このHBMビット税によって直接消費される
そのため、DRAMビットボリュームは将来的に年間約24%増加する(14%はウェーハ増加、9%はウェーハあたりのDRAM密度向上)が、HBMビット税を考慮すると、従来型で非HBMのコモディティDDRの年間ビット成長率は約20%にとどまる(ウェーハ増加約10%×ノード密度向上約9%)
中国の長鑫の増産の影響はどの程度か?もし無秩序に増産を続ければ、この市場を再び周期の泥沼に引きずり込むのか?
長鑫のここ数年の増産ペースは依然として速く、2025年は月20万ウェーハだが、2026年には北京のウェーハ工場と新たな生産ラインの寄与により32~35万ウェーハに達する見込みである。
建設中の上海工場の第1期は2027年までに月10万ウェーハの生産能力を追加、第2期は2028年までに月10万ウェーハの生産能力を追加する見込みである。つまり、2027年には月42万ウェーハ、2028年には月50万ウェーハに達する可能性がある。
ただし注意すべき点として、長鑫のDRAMビット密度は御三家(Samsung、SK Hynix、Micron)の約半分であるため、長鑫の月50万ウェーハから生産できるDRAMビットボリュームは他社の半分に過ぎない。ここでの月間ウェーハ数(WPM)の計算は、等価で半分として計算する
この割引を適用すると、長鑫がDRAM業界全体に与える影響はかなり小さくなる。2025年末から2028年末までに、長鑫がDRAMビット生産能力のCAGRに与える影響は約1.5%に過ぎず、業界全体のDRAM生産能力のCAGRは約12.7%から14.2%に上昇する程度である
・DRAM月間生産能力 (kwspm) 2025E → 2028E CAGR ・Samsung 685K → 920K 10.3% ・SK Hynix 519K → 725K 11.8% ・Micron 340K → 560K 18.1% ・中国以外のその他 150K → 218K 13.3% ・中国 (密度半減) 117K → 274K 32.8% ・中国を含む合計 1811K → 2697K 14.2% ・中国を除く合計 1694K → 2423K 12.7%
たとえ長鑫が今後も増産ペースを維持したとしても、2030年に業界全体の等価生産能力に対する年間DRAMビットボリューム増加CAGRへの影響は約3%未満であり、CAGRが20%から23%になる程度である。
さらに、長鑫は露光装置に制約を受けており、DDR6はより高速(14400 MT/s以上)と高密度を必要とする。御三家はDDR6に1c以降のより先進的なノード(約12nm以下)を使用する可能性が高く、すでにEUVを全面的に使用している。長鑫はDDR6の速度に制約を受け、密度も半分にとどまる可能性がある。
成長周期であっても、なぜDRAMの今回のスーパーサイクルは長期間、少なくとも5年は終わりが見えないのか?
第一の理由は、先ほど述べたCPUサーバー需要側の巨大な成長による構造的なDRAM需要の指数関数的成長である。ここでDRAM供給側のビットボリュームCAGRが約20%で安定していることを考慮すると、DRAMの今後数年のギャップがなぜ拡大し続けるのかが明確に見える:
非HBMの従来型DRAMの供給側は年間約20%増加する。一方、需要側は、2026年に600億ドルのCPU TAM、CPUあたり平均8GB/コアのDRAM消費、コアあたり30~35ドルと仮定すると、需要は16EBとなる。
2030年に4000億ドルのCPU TAM、CPUあたり平均16GB/コアのDRAM消費、コアあたり80ドル(CPU価格は2倍以上上昇)と仮定すると、需要は80EBとなる。このDRAM需要の成長CAGRは約50%であり、現在の推定値をはるかに上回る。
HBMがトークンスループットに直接結びつき、GPUの収益効率に直結するのとは異なり、DRAM不足がエージェントフローに与える影響は主に速度である。例えば、8GB/コアと16GB/コアを比較すると、一部のワークロードでは速度が30%低下する可能性がある。一部の価値の低いタスクは待つこともできる。構造的な指数関数的成長の動機は非常に強いが、需要はGPUほど硬直的ではない。
Semianalysisによると、今年のDRAMのギャップは一桁台のパーセンテージ、来年は10%を超えるとしている。エージェントCPUの急増によるDRAMの構造的状況から見ると、このギャップは毎年拡大し続け、2030年までは減少する可能性は低い。
DRAMが長期にわたって強い状態を維持できるもう一つのロジックは、DRAMの値上げによって消滅した需要の一部は実際には消えたのではなく、単に遅延しているだけであり、需要の貯水池が多すぎることである。
いわゆる貯水池とは、「メモリ価格が下がればすぐに解放される潜在需要」のことである。これらが存在するということは、たとえ供給が一時的に追いついても、価格が暴落しにくいことを意味する。なぜなら、常に貯水池から新しい需要が湧き出て買い支えるからだ:
メモリの計算能力/速度の貯水池:
本来は追加のメモリによって速度と計算力を最適化する必要がある需要が大量に存在し、メモリが高すぎる間は抑制されているが、メモリ価格が下がれば解放される。
例えば、NvidiaのCPXプリフィルアクセラレーションは、本来は追加の低コストGDDR7を使用して専用のプリフィルアクセラレーターを構築する設計だったが、LPDDR/GDDRが高すぎて(値上げ前のHBMよりも高い)、この方式のROIが合わなくなった。しかし、通常のメモリ価格が下落すれば、CPXのような最適化方式は再び戻ってくるだろう。
低価値タスクの貯水池:メモリ価格上昇によりトークン価格が高止まりすると、高価値タスクが優先され、低価値タスクは延期される。メモリ価格が下がれば、延期されていた需要は戻ってくる。
エッジAIの貯水池:AI PCのメモリ構成は24GBから128GBまで上昇する可能性がある。Appleはすでに最新のエッジAIフルバージョンに8GBから12GBへのメモリアップグレードを要求している。
通常のコンシューマーエレクトロニクス、エージェントPC、低価格帯スマートフォンなど、メモリ価格上昇によって減少した需要はすべて貯水池である。
これほど多くの貯水池が積み重なることで、極めて厚い需要の緩衝材が形成される。これが、今回のDDRの構造的成長が市場の想定よりも持続力を持つ理由である。
DRAM価格が大幅に下落しにくいもう一つの理由は、HBMとDRAMの生産能力が相互に変換可能であるため、DRAMコンプレックス全体が一緒にre-rateされることである。
上昇局面ではDRAMの利益率がHBMをはるかに上回り、HBMの値上げ幅はむしろDRAMによって推進される。今年新たに契約されたHBM4の価格は、当期のDRAM価格×4、つまり通常の積層倍率に対応するHBM4の価格である。
一度DRAMの価格が下落して利益率が低下すると、HBMの長期契約の透明性により利益率は保証されているため、HBMは間接的にDRAMの生産能力をさらに引き抜くことになる。また、HBMの価格下落はGPUメーカーが可能な限りHBMサイズをアップグレードする動機を強め、これも間接的にDRAMの価格下限を保証することになる。
DRAMには構造的な指数関数的需要の増加があり、密度スケーリングの鈍化により増産の難易度が増しており、メーカーの増産計画は慎重であり、長鑫の影響もここ数年は限定的であり、さらに需要の貯水池が非常に大きい。これら4つの理由により、少なくとも今後5年以上、DRAMが景気循環の谷に入ることは困難である。
NAND SSDは従来の周期性から脱却する見込みはあるか?
NANDの構造的成長の原動力はDDRほど強くない。今年の品不足の主な理由は、主要プレーヤー数社の生産規律が良好に維持されており、大規模な増産を行っていないこと、毎年の生産能力増加は主に技術改良(NAND積層数の増加)によるものである。
最初の構造的成長はAIによるもので、主にKVキャッシュのオフローディングであり、HBMからあふれたウォーム/コールドKVキャッシュをNAND SSDにオフロードするものだ。
しかし驚くべきことに、このKVキャッシュオフローディングの成長はまだ大規模には発生していないにもかかわらず、SSDはすでにDRAMよりも深刻な品不足となっており、値上げ幅もDRAMを上回っている。来年にRubin CMXが出荷され、KVキャッシュオフローディングが本格的に適用されるようになれば、SSDの品不足はこの構造的成長によってさらに拡大するだろう。
第二に、昨年の年間総括で言及した将来有望なAIビデオによる構造的増加分は、今年すでに注目を集める状況になっている。
Seedanceのボリュームは年10倍から40倍のペースで成長している。現在、まだGPU不足に悩まされており、需要は計算能力によって抑制されて完全には解放されていない。しかし、GPU不足の段階が過ぎれば、AIビデオによるNANDストレージの構造的需要成長は、かなり長期間続くだろう。
第三の構造的成長も、エージェントフローによるサンドボックス使用量の指数関数的増加に由来する。サンドボックスはデータの安全性と分離を確保するため、例えばAnalytical Agentはタスクごとに大量のデータベースとユーザーコンテキストを複製する必要があり、メモリ(DRAM)とCPUコアの深刻な浪費を引き起こすとともに、大量のSSDの浪費(需要)ももたらす。
第四の構造的成長は、おそらく2030年以降に効果を発揮するもので、HBF技術がSSDを必要とすることに由来する。多くの投資銀行分析で期待されているが、この技術はまだ遠い未来のものであり、主な役割は大規模モデルの重みを格納すること、一度重みを書き込んで読み取り専用とすることであり、さらにGPU/HBMとパッケージングされる必要がある(48TBps/96TBps)。そうでなければ、PCIE7/8では速度が遅すぎて全く使用できない。将来が期待されるが、次回の「AI半導体終局推演2026(III)」でより詳細な分析を行う予定である。
要するに、NAND SSDの構造的成長はHBMほど強力ではないが、安価であることが強みであり、2027年でも価格はわずか0.8ドル/GBで、同期のDRAMの40分の1である。そのため、マルチレベルキャッシュにおける何でも屋的な特性を持ち、構造的成長の源泉が非常に幅広い。
つまり、DRAM/HBMだけが値上がりで好況となる一方で、SSDが値上がりしないという状況は存在しない。なぜなら、もしそのような状況が発生すれば、誰もがSSDを使用してDRAM/HBMの一部の機能を代替しようとし、より低コストで同様の効果を実現しようとするからだ。HBM、DRAM、NANDは独立した3つの物語ではなく、同じAIメモリ階層における異なる温度帯での構造的成長である。
構造的な指数関数的需要の増加があるとして、NAND SSDは周期から脱却したのか?そのためには、NAND SSDメーカーの生産規律に依存する。唯一生産規律を守らない可能性があるのは長存(YMTC)である。これは囚人のジレンマであり、一社が無秩序に増産を始めれば、NAND業界全体の増産難易度はDRAMよりもはるかに低い。
しかし最低限、今回のNANDもスーパーサイクルであり、いくつかの構造的な指数関数的成長による需要により、下降局面は2030年まで問題なく遅延できるだろう。
クリックして律動BlockBeatsの募集中のポジションを確認
律動 BlockBeats の公式コミュニティへようこそ:
Telegram 購読グループ:https://t.me/theblockbeats
Telegram 交流グループ:https://t.me/BlockBeats_App
Twitter 公式アカウント:https://twitter.com/BlockBeatsAsia