AI産業の価値の重心が構造的に移行している。
過去2年間、NVIDIA、メモリメーカー、エネルギー供給業者がAI投資リターンの配分を主導してきたが、エージェンティックAI(Agentic AI)の商用化加速に伴い、モデル層の利益空間はかつてない速度で拡大している。一方、計算リソース供給側を掌握するNVIDIAとTSMCは、このトレンドをまだ価格設定に十分反映していない。
Anthropicはこの転換の最も直接的な証左である。SemiAnalysisの最新調査によれば、Anthropicの年換算売上高(ARR)は年初の90億ドルから440億ドル以上に急増し、推論インフラの粗利率は同期間に38%から70%超へ上昇した。同時に、トークン(token)の生産コストはハードウェアの進化とソフトウェア最適化により大幅に圧縮され、価値とコストの乖離(ハサミ状格差)は拡大を続け、モデルメーカーを急速な利益率上昇の新たな段階へと押し上げている。
供給側では、NVIDIAとTSMCが最も希少なリソースを抱えながらも、現在の需要の盛り上がりに十分な価格対応をしていない。SemiAnalysisは、この価格設定の遅れが重要な市場のミスマッチを構成していると見る。Vera Rubin(VR NVL72)に代表される次世代システムには顕著な価格上昇余地があり、この価値再配分で誰が先手を打つかが、AI産業チェーンの各セグメントにおける投資ロジックに深く影響する。
2023年から2025年にかけて、AI投資の超過リターンは主にインフラ層に集中していた。
NVIDIAは2023年5月に初の爆発的な決算を発表、時間外取引で25%急騰し、AI投資の波を正式に開始した。2024年にはVistraとGE Vernovaがそれぞれ265%と146%上昇し、S&P500の最強銘柄となり、エネルギー制約が市場の焦点となった。2025年にはメモリセクターがリードを引き継ぎ、SanDisk、Western Digital、Seagate、Micronなどが年間200%超の上昇を記録し、ストレージの需給不均衡が価格決定の主要変数となった。
一方、モデルメーカーと推論サービスの粗利率は長期的に低迷していた。当時、AIの実際の有用性は批評家から「より良いGoogle検索」にチャットインターフェースを加えただけのものとされ、数兆ドル規模の資本支出予想と大きく乖離していた。
この構図は2025年末に根本的な転換を迎えた。
SemiAnalysisは2025年12月をAI商用化の真の転換点と見なしている。エージェンティックAIが安定稼働し、企業のワークフローに大規模に導入され始めた。この変化の核心的意義は、トークンの経済的価値を根本的に変えたことにある。
SemiAnalysis自身を例にとると、その年間トークン支出は従業員給与総額の約30%に相当し、従業員1人当たりの月間トークン消費量は50億個超で、Metaの社内平均の5倍以上である。 研究チームは複数の実例を挙げている:かつては初級アナリストが数時間かけて行っていた財務モデリング、グラフ作成、収益分析などの作業が、今ではエージェントによって極めて低いトークンコストで完了し、同等の人的コストは数百~数千ドルに達していた。
同時に、トークンの生産コストは急激に低下している。SemiAnalysisの推定では、エージェントタスクシナリオにおいて、Opus 4.7を実行する実際の混合価格は100万トークンあたり約0.99ドルとなり、公式価格の5ドル/25ドルを大きく下回る。その理由は、エージェントのワークロードが極めて高い入出力比(約300:1)と90%超のキャッシュヒット率を持ち、多くのトークンが最低価格帯に該当するためである。
ハードウェア面での加速も顕著だ。1年前のH100と比較して、Blackwellシリーズは最先端ワークロードにおいて1秒あたりに生成できるトークン数が約30倍向上した。さらに比較すると、最適化されたGB300 NVL72は最適化H100に対してFP8精度でスループットが約17倍、FP4に切り替えるとその差は32倍に拡大し、総所有コスト(TCO)は約70%高いだけである。
価値とコストの双方向のハサミ状格差こそが、Anthropicの粗利率を38%から70%超へと押し上げた核心的な推進力である。
モデルメーカーの利益率の急速な拡大に対し、市場で最も一般的な疑問は「競争が結局は価格を押し下げる」というものだ。SemiAnalysisはこれに慎重な見解を示し、2つの根拠を挙げている。
第一に、最先端のクローズドソースモデルの価格決定権は依然として強固である。 オープンソースモデルのベンチマークスコアは更新され続けているが、実際の知識作業シナリオでは、そのパフォーマンスは明らかにクローズドソースの最先端モデルに劣る。Kimi K2.6(価格0.95ドル/4ドル)を例にとっても、Anthropic Opusの価格に対する下押し圧力は極めて限定的である。
第二に、計算リソースの制約により、どの最先端ラボも市場全体の需要を単独で満たすことはできない。 Anthropicはすでに、Claude Codeを月額100ドル以上のサブスクリプション閾値の背後にロックし、サードパーティのアクセスを制限するなどして需要を積極的に管理しており、トークン需要は予見可能な将来にわたって供給を上回り続ける。この構造的希少性が、最先端モデルメーカーにコストではなく価値に基づく価格設定の余力を与えている。
Anthropicは製品ライン戦略を通じてこのロジックを実践している。Opus fastの価格は通常Opusの6倍、近日発売予定のMythosは25ドル/125ドルで通常Opusの5倍であり、トップ企業顧客はこれらの高価格SKUに対しても支払う用意がある。SemiAnalysisによれば、AnthropicがMythos fastを150ドル/750ドルに設定しても、同社自身が有料ユーザーになるだろうという。
しかし、最も核心的な希少資源を掌握する2社――NVIDIAとTSMC――は、この価値再評価の波に十分追いついていない。
TSMCのN3先進プロセス容量は、AI計算リソース拡大の最も逼迫したボトルネックとなっている。NVIDIA、Broadcom、Annapurna、MediaTek、AMDが限られたN3ウェーハ割り当てを争っており、N3の稼働率は2026年下半期に100%を超えると予想されている。DRAMウェーハ工場の稼働率は90%超、メモリ全体の供給はタイトだが、価格設定は比較的保守的である。
SemiAnalysisの見解では、TSMCには大幅な値上げの条件が整っており、顧客はそれを受け入れるだけでなく、一部の顧客は歓迎さえするだろう。NVIDIAはその典型例だ。TSMCの値上げが競合他社の容量割り当て減少を意味するなら、NVIDIAがより高いウェーハ価格を支払うことは、むしろ市場での地位を強化するのに有利に働く。NVIDIAのCEOであるジェンスン・フアンは2024年にTSMCはウェーハ価格を上げるべきだと公言しており、その背後にあるロジックはまさにこれである。
NVIDIA自身の価格設定戦略も、同様の保守的な傾向を示している。SemiAnalysisは、NVIDIAの価格設定フレームワークが依然として「単位計算能力あたりの支払意思額は時間とともに低下する」という前提に固定されているが、この前提はもはや成立しないと指摘する。エージェントワークロードの爆発に伴い、計算需要は線形成長ではなく、複合的な加速パターンを示している。
2026年下半期にリリース予定のVera Rubin(VR NVL72)を基準として、SemiAnalysisは「One Chart to Rule Them All」という価格設定分析フレームワークを構築し、コスト側とバリュー側からそれぞれレンタル価格の下限と上限を定めた。
コスト側(下限):Neocloud(新興クラウドサービスプロバイダー)プロジェクトの内部収益率(IRR)が15.6%以上という展開閾値に基づき、VR NVL72の1時間あたりGPUあたりの最低レンタル価格は約4.92ドルが必要であり、Neocloudの展開意欲を維持できる。
バリュー側(上限):GB300の現在の5年契約レンタル価格が約1PFLOPあたり0.70ドルであることを基準とすると、VR NVL72の対応するレンタル価格上限は1時間あたりGPUあたり約12.25ドルとなる。
現在、VR NVL72システムの価格設定により、1PFLOPあたりのコストは約0.28ドルに低下し、GB300 NVL72と比較して60%の削減となり、歴史的なトレンドラインの改善幅を大きく上回る。これは、NVIDIAのサーバー価格に約40%の値上げ余地があることを意味し、値上げ後もNeocloudに十分な利益余地を残し、全体のコスト改善幅は依然として歴史的トレンドを下回る。
SOCAMMメモリ価格設定はもう一つの重要な変数である。VR NVL72はソケット型LPDDR5Xメモリモジュール(SOCAMM)を採用し、計算ユニットとは独立した価格設定が可能である。SemiAnalysisの推定では、NVIDIAが2026年第1四半期に支払うSOCAMMの契約価格は約1GBあたり8ドルで、前期比で顕著な上昇となる。2026年末までにはSOCAMM価格が1GBあたり13ドルを超える可能性がある。この背景において、NVIDIAがSOCAMMで60%の粗利率を実現することは、論理的に合理性を持つ。一方でメモリ供給は制約され、NVIDIAは最大のシェア優位性を掌握している。他方、VR NVL72のTCO面での性能優位性により、顧客には代替選択肢が不足している。
SemiAnalysisのフレームワークは、現在のAI価値配分の核心的矛盾を明らかにしている。トークンエコノミクスの改善は、モデルメーカー、推論サービスプロバイダー、Neocloudの利益を急速に押し上げているが、計算リソース供給側で最も希少なリソースを掌握するNVIDIAとTSMCの価格設定行動は、供給の希少性との間に明らかなミスマッチがある。
このミスマッチの継続は、本質的に能動的な選択である。NVIDIAは一種の「AI中央銀行」のような役割を果たしており、ソフトウェア効率の向上を通じて下流に価値を供給し、エコシステムの長期的拡大の原動力を維持すると同時に、反トラスト規制の圧力を回避している。TSMCは歴史的に「エコシステムを安定させ、上振れ利益をすべて取り尽くさない」という価格設定哲学を継続している。
しかし、推論のROIがますます明確になり、価値に基づく価格設定ロジックが市場に普及するにつれ、これら2社が価値価格設定フレームワークに移行する圧力は高まり続ける。一度移行が起これば、AI産業チェーンの価値配分構造は再び再編される。その時、計算リソース供給側の交渉力は、より大きな程度でハードウェア層に回帰する。
リスク注意事項と免責条項
市場にはリスクが伴い、投資には慎重さが求められます。本稿は個人投資のアドバイスを構成するものではなく、個々のユーザーの特別な投資目標、財務状況、またはニーズを考慮したものでもありません。ユーザーは本稿に含まれる意見、見解、または結論が自身の特定の状況に適合するかどうかを検討する必要があります。これに基づく投資については、自己責任において行ってください。
1.66M 人気度
357.89K 人気度
65.66K 人気度
129.57K 人気度
605.53K 人気度
SemiAnalysis:インフラからモデル層まで、AIバリューチェーンにおける富の移転が加速している。
AI産業の価値の重心が構造的に移行している。
過去2年間、NVIDIA、メモリメーカー、エネルギー供給業者がAI投資リターンの配分を主導してきたが、エージェンティックAI(Agentic AI)の商用化加速に伴い、モデル層の利益空間はかつてない速度で拡大している。一方、計算リソース供給側を掌握するNVIDIAとTSMCは、このトレンドをまだ価格設定に十分反映していない。
Anthropicはこの転換の最も直接的な証左である。SemiAnalysisの最新調査によれば、Anthropicの年換算売上高(ARR)は年初の90億ドルから440億ドル以上に急増し、推論インフラの粗利率は同期間に38%から70%超へ上昇した。同時に、トークン(token)の生産コストはハードウェアの進化とソフトウェア最適化により大幅に圧縮され、価値とコストの乖離(ハサミ状格差)は拡大を続け、モデルメーカーを急速な利益率上昇の新たな段階へと押し上げている。
供給側では、NVIDIAとTSMCが最も希少なリソースを抱えながらも、現在の需要の盛り上がりに十分な価格対応をしていない。SemiAnalysisは、この価格設定の遅れが重要な市場のミスマッチを構成していると見る。Vera Rubin(VR NVL72)に代表される次世代システムには顕著な価格上昇余地があり、この価値再配分で誰が先手を打つかが、AI産業チェーンの各セグメントにおける投資ロジックに深く影響する。
AI価値プールの3年間の移行経路
2023年から2025年にかけて、AI投資の超過リターンは主にインフラ層に集中していた。
NVIDIAは2023年5月に初の爆発的な決算を発表、時間外取引で25%急騰し、AI投資の波を正式に開始した。2024年にはVistraとGE Vernovaがそれぞれ265%と146%上昇し、S&P500の最強銘柄となり、エネルギー制約が市場の焦点となった。2025年にはメモリセクターがリードを引き継ぎ、SanDisk、Western Digital、Seagate、Micronなどが年間200%超の上昇を記録し、ストレージの需給不均衡が価格決定の主要変数となった。
一方、モデルメーカーと推論サービスの粗利率は長期的に低迷していた。当時、AIの実際の有用性は批評家から「より良いGoogle検索」にチャットインターフェースを加えただけのものとされ、数兆ドル規模の資本支出予想と大きく乖離していた。
この構図は2025年末に根本的な転換を迎えた。
エージェンティックAI:トークンエコノミクスを再定義する転換点
SemiAnalysisは2025年12月をAI商用化の真の転換点と見なしている。エージェンティックAIが安定稼働し、企業のワークフローに大規模に導入され始めた。この変化の核心的意義は、トークンの経済的価値を根本的に変えたことにある。
SemiAnalysis自身を例にとると、その年間トークン支出は従業員給与総額の約30%に相当し、従業員1人当たりの月間トークン消費量は50億個超で、Metaの社内平均の5倍以上である。 研究チームは複数の実例を挙げている:かつては初級アナリストが数時間かけて行っていた財務モデリング、グラフ作成、収益分析などの作業が、今ではエージェントによって極めて低いトークンコストで完了し、同等の人的コストは数百~数千ドルに達していた。
同時に、トークンの生産コストは急激に低下している。SemiAnalysisの推定では、エージェントタスクシナリオにおいて、Opus 4.7を実行する実際の混合価格は100万トークンあたり約0.99ドルとなり、公式価格の5ドル/25ドルを大きく下回る。その理由は、エージェントのワークロードが極めて高い入出力比(約300:1)と90%超のキャッシュヒット率を持ち、多くのトークンが最低価格帯に該当するためである。
ハードウェア面での加速も顕著だ。1年前のH100と比較して、Blackwellシリーズは最先端ワークロードにおいて1秒あたりに生成できるトークン数が約30倍向上した。さらに比較すると、最適化されたGB300 NVL72は最適化H100に対してFP8精度でスループットが約17倍、FP4に切り替えるとその差は32倍に拡大し、総所有コスト(TCO)は約70%高いだけである。
価値とコストの双方向のハサミ状格差こそが、Anthropicの粗利率を38%から70%超へと押し上げた核心的な推進力である。
モデル層の価格決定権:なぜ競争に侵食されないのか
モデルメーカーの利益率の急速な拡大に対し、市場で最も一般的な疑問は「競争が結局は価格を押し下げる」というものだ。SemiAnalysisはこれに慎重な見解を示し、2つの根拠を挙げている。
第一に、最先端のクローズドソースモデルの価格決定権は依然として強固である。 オープンソースモデルのベンチマークスコアは更新され続けているが、実際の知識作業シナリオでは、そのパフォーマンスは明らかにクローズドソースの最先端モデルに劣る。Kimi K2.6(価格0.95ドル/4ドル)を例にとっても、Anthropic Opusの価格に対する下押し圧力は極めて限定的である。
第二に、計算リソースの制約により、どの最先端ラボも市場全体の需要を単独で満たすことはできない。 Anthropicはすでに、Claude Codeを月額100ドル以上のサブスクリプション閾値の背後にロックし、サードパーティのアクセスを制限するなどして需要を積極的に管理しており、トークン需要は予見可能な将来にわたって供給を上回り続ける。この構造的希少性が、最先端モデルメーカーにコストではなく価値に基づく価格設定の余力を与えている。
Anthropicは製品ライン戦略を通じてこのロジックを実践している。Opus fastの価格は通常Opusの6倍、近日発売予定のMythosは25ドル/125ドルで通常Opusの5倍であり、トップ企業顧客はこれらの高価格SKUに対しても支払う用意がある。SemiAnalysisによれば、AnthropicがMythos fastを150ドル/750ドルに設定しても、同社自身が有料ユーザーになるだろうという。
NVIDIAとTSMC:希少資源の価格設定の遅れ
しかし、最も核心的な希少資源を掌握する2社――NVIDIAとTSMC――は、この価値再評価の波に十分追いついていない。
TSMCのN3先進プロセス容量は、AI計算リソース拡大の最も逼迫したボトルネックとなっている。NVIDIA、Broadcom、Annapurna、MediaTek、AMDが限られたN3ウェーハ割り当てを争っており、N3の稼働率は2026年下半期に100%を超えると予想されている。DRAMウェーハ工場の稼働率は90%超、メモリ全体の供給はタイトだが、価格設定は比較的保守的である。
SemiAnalysisの見解では、TSMCには大幅な値上げの条件が整っており、顧客はそれを受け入れるだけでなく、一部の顧客は歓迎さえするだろう。NVIDIAはその典型例だ。TSMCの値上げが競合他社の容量割り当て減少を意味するなら、NVIDIAがより高いウェーハ価格を支払うことは、むしろ市場での地位を強化するのに有利に働く。NVIDIAのCEOであるジェンスン・フアンは2024年にTSMCはウェーハ価格を上げるべきだと公言しており、その背後にあるロジックはまさにこれである。
NVIDIA自身の価格設定戦略も、同様の保守的な傾向を示している。SemiAnalysisは、NVIDIAの価格設定フレームワークが依然として「単位計算能力あたりの支払意思額は時間とともに低下する」という前提に固定されているが、この前提はもはや成立しないと指摘する。エージェントワークロードの爆発に伴い、計算需要は線形成長ではなく、複合的な加速パターンを示している。
Rubinシステム:NVIDIAの価格設定余地の定量化
2026年下半期にリリース予定のVera Rubin(VR NVL72)を基準として、SemiAnalysisは「One Chart to Rule Them All」という価格設定分析フレームワークを構築し、コスト側とバリュー側からそれぞれレンタル価格の下限と上限を定めた。
コスト側(下限):Neocloud(新興クラウドサービスプロバイダー)プロジェクトの内部収益率(IRR)が15.6%以上という展開閾値に基づき、VR NVL72の1時間あたりGPUあたりの最低レンタル価格は約4.92ドルが必要であり、Neocloudの展開意欲を維持できる。
バリュー側(上限):GB300の現在の5年契約レンタル価格が約1PFLOPあたり0.70ドルであることを基準とすると、VR NVL72の対応するレンタル価格上限は1時間あたりGPUあたり約12.25ドルとなる。
現在、VR NVL72システムの価格設定により、1PFLOPあたりのコストは約0.28ドルに低下し、GB300 NVL72と比較して60%の削減となり、歴史的なトレンドラインの改善幅を大きく上回る。これは、NVIDIAのサーバー価格に約40%の値上げ余地があることを意味し、値上げ後もNeocloudに十分な利益余地を残し、全体のコスト改善幅は依然として歴史的トレンドを下回る。
SOCAMMメモリ価格設定はもう一つの重要な変数である。VR NVL72はソケット型LPDDR5Xメモリモジュール(SOCAMM)を採用し、計算ユニットとは独立した価格設定が可能である。SemiAnalysisの推定では、NVIDIAが2026年第1四半期に支払うSOCAMMの契約価格は約1GBあたり8ドルで、前期比で顕著な上昇となる。2026年末までにはSOCAMM価格が1GBあたり13ドルを超える可能性がある。この背景において、NVIDIAがSOCAMMで60%の粗利率を実現することは、論理的に合理性を持つ。一方でメモリ供給は制約され、NVIDIAは最大のシェア優位性を掌握している。他方、VR NVL72のTCO面での性能優位性により、顧客には代替選択肢が不足している。
価値の帰着:誰が勝ち、誰が待つのか
SemiAnalysisのフレームワークは、現在のAI価値配分の核心的矛盾を明らかにしている。トークンエコノミクスの改善は、モデルメーカー、推論サービスプロバイダー、Neocloudの利益を急速に押し上げているが、計算リソース供給側で最も希少なリソースを掌握するNVIDIAとTSMCの価格設定行動は、供給の希少性との間に明らかなミスマッチがある。
このミスマッチの継続は、本質的に能動的な選択である。NVIDIAは一種の「AI中央銀行」のような役割を果たしており、ソフトウェア効率の向上を通じて下流に価値を供給し、エコシステムの長期的拡大の原動力を維持すると同時に、反トラスト規制の圧力を回避している。TSMCは歴史的に「エコシステムを安定させ、上振れ利益をすべて取り尽くさない」という価格設定哲学を継続している。
しかし、推論のROIがますます明確になり、価値に基づく価格設定ロジックが市場に普及するにつれ、これら2社が価値価格設定フレームワークに移行する圧力は高まり続ける。一度移行が起これば、AI産業チェーンの価値配分構造は再び再編される。その時、計算リソース供給側の交渉力は、より大きな程度でハードウェア層に回帰する。
リスク注意事項と免責条項