計算能力が再び集中しつつある:DeepSeekの価格引き下げ後、誰がAIの基盤インフラを掌握するのか?

null

——GonkaがLA Hacks 2026での講演から始めて

4月26日、DeepSeekはV4シリーズAPIの新価格を発表:全シリーズの入力キャッシュヒット価格を初期価格の10分の1に引き下げ、Proバージョンは期間限定の割引を適用し、100万トークンの処理コストを0.025元まで抑えた——これは1年前と比べてほぼ百倍安くなった。A株の計算力セクターは当日全てストップ高を記録し、市場の熱狂を呼んだ。

しかし歓声の背後には、誰も正面から議論しない問題がある:モデルがますます安くなるにつれ、モデル運用に必要な計算力がますます集中している。

データは嘘をつかない。2025年第4四半期、Microsoft、Amazon、Meta、Googleの4大クラウド事業者の資本支出は前年比64%増の1186億ドルに達した;2026年通年の合計資本支出はさらに前年比53%増の5708億ドルに上ると予測されている。Googleは同時に、2026年のTPUチップ出荷目標を50%引き上げ600万個に設定した。NVIDIAのH100シリーズの納品サイクルは、一部市場ではすでに数ヶ月に及んでいる。

モデル層の価格決定権は開発者に傾きつつあるが、計算力層のコントロールはより速い速度で少数の巨大企業に集中している。これはAI時代の隠れた深刻な矛盾の一つだ。

この背景のもと、2026年4月24日、Gonkaプロトコルの共同創設者DaniilとDavid LibermanはLA Hacks 2026の基調講演台に立った。今年のUCLA最大のハッカソンであり、Liberman兄弟が基調講演者を務めるのは初めてだ。数百人のトップエンジニアたちがこの業界に足を踏み入れようとしている中、彼は非常に明確な問いを投げかけた:分散型計算力、まだ間に合うのか?

一、価格引き下げの裏側

DeepSeek V4の価格引き下げの論理は、一見、技術進歩による効率向上の恩恵だ——新しい注意メカニズムはTokenの次元を圧縮し、DSA疎結合注意と組み合わせることで、計算とGPUメモリの需要を大幅に削減している。しかし、価格が持続的に下がるためには、どこかの計算力が十分に豊富で、安価である必要がある。

現実には、「十分に豊富な」計算力の供給源は、世界的に少数のノードに急速に集中している。光通信のリーディング企業LumentumのCEO、Michael Hurlstonは最近、現在のトレンドに従えば、2028年までに同社の生産能力はほぼ完売状態になると述べた。これは一部企業だけの問題ではなく、AIインフラのサプライチェーン全体が高速拡大の需要に直面している集団的な緊張状態だ。

DaniilはLA Hacksの講演で、シンプルだが力強い対比を用いた:ビットコインネットワークの計算力は、Google、Microsoft、Amazonの3つのクラウドデータセンターの合計を超えている——しかし、それらの計算力は何をしているのか?誰も答えを必要としないハッシュの謎を解いているだけだ。世界中の余剰GPU計算力も同様だ:ゲーマーのPCのGPU、大学のサーバールーム、中小クラウドサービスの余剰リソースは膨大だが、調整メカニズムが欠如しているため、AI推論には使われていない。

Gonkaが解決しようとしているのは、この調整の問題だ——PoW(プルーフ・オブ・ワーク)のインセンティブメカニズムを用いて、世界中に散らばる未使用GPUを組織し、実際のAI推論タスクを処理できるネットワークにすることだ。

二、推論は新たな戦場

DeepSeekの価格引き下げは、中国のインターネット界で「AIの平等化」について広く議論を巻き起こした。しかし、見落とされがちな細部がある:価格を下げたのは「呼び出しコスト」であり、「計算力コスト」ではない。AIの応用規模が拡大するにつれ、推論呼び出しの増加は指数関数的だ——業界予測によると、2026年には推論が世界のAI計算力消費の約3分の2を占めるとされている。

これは何を意味するのか?呼び出しコストを1桁下げるたびに、必要な計算力の総量はむしろ増加するだけだ。大規模モデルの「民主化」は、ある意味で計算力層の集中化を加速させている——なぜなら、超低マージンで推論サービスを維持できるのは、大規模な計算力を持つプレイヤーだけだからだ。

これは、構造的なロックインの形成だ:推論側の物理計算力を掌握する者が、AI時代の真のインフラの入り口を握る。こうした観点から、分散型計算力ネットワークの意義は、「コストを50%削減」することだけではなく、集中化のロックインが完了する前に、代替の構造的ルートを提供することにある。

三、若き構築者への真の問い

LA Hacksの参加者——カリフォルニアのトップ大学のエンジニアやプロダクト担当者——は、すぐに次の難しいエンジニアリングの選択に直面する:自分のプロダクトをどの計算層に置くのか。

あなたのAIプロダクトは、誰のサーバーを推論呼び出しに使っているのか?

そのプラットフォームが価格戦略やアクセスポリシーを変更したとき、あなたは移行できるのか?

あなたが築いたユーザースケールは、自分に価値をもたらすのか、それともプラットフォームにチップを送っているだけなのか?

これらの問いは、Web2時代に開発者たちが一度経験したものだ:アプリの運命がプラットフォームのアルゴリズムや配信ルールと深く結びついたとき、「独立」は常に再定義を迫られる言葉となる。AI時代の計算力依存は、同じロジックをインフラ層に再現し、しかも切り替えコストが高いため、ロックイン効果はより強まる。

ハッカソンという形式には、内在する皮肉もある:36時間以内に、最小限のリソースと最速のスピードで動作可能なものを構築する——これこそが、分散型ネットワークのインセンティブメカニズムが追求する状態だ。DaniilがLA Hacksの壇上に立つのは、Gonkaについて語るためだけではなく、この集団に問いかけている:あなたたちの未来の仕事は、この集中化の流れを加速させることなのか、それとも新たな可能性を生み出すことなのか?

四、PoW 2.0:エンジニアリングの命題

GonkaはPoW(プルーフ・オブ・ワーク)のインセンティブ構造をハッシュ計算からAI推論に再調整し、ネットワーク内のほぼ100%の計算力を実際のタスクに直接対応させる仕組みだ。このメカニズムには、エンジニアリング上の重要な要件がある:AI推論タスクは検証可能で再現性があること——同じモデルの重み、同じ乱数シード、同じ入力を与えれば、どのノードも計算結果を再現し、その有効性を検証できること。これがGonkaが学術的なプロトタイプから実運用可能なネットワークへと進化するための核心的な技術的課題だ。

経済学的に見ると、この仕組みの意義は、トークンの価値が物理的計算力コストに自然に連動し、流動性の感情に依存しない点にある。計算力を提供するマイナーは報酬を得て、計算力を呼び出す開発者は料金を支払う。全体のインセンティブの閉ループは、仲介者の善意に頼らない。

もちろん、技術的な実現性は一部に過ぎない。より難しいのは、計算力需要が急速に増大し、巨大企業の資本支出が数十億ドル単位に達する時代に、コミュニティの自発的貢献による分散型計算力ネットワークが、規模の点で真の競争力を持てるのかという点だ。

Gonkaの初期データは、参考となる座標を示している:メインネットの稼働開始から1年未満で、ネットワークの合計計算力は60台のH100相当から1万台超に拡大した。この速度は、世界中の数百の独立ノードの自発的参加によるものであり、中央集権的な調整ではない。これが規模の問題が解決したことを証明するわけではないが、インセンティブメカニズムが早期の成長を効果的に促したことを示している。

五、ウィンドウの問題

歴史的に、インフラの支配権は早期に急速に収束する傾向がある——鉄道時代も、インターネット時代も、モバイルインターネット時代も同じだ。各時代の標準が固まる前に、誰かが入り込む余地を見つけ、標準化が完了した後に参加権が大きく狭まる。

現在のAI計算力インフラはどの段階にあるのか?2026年の5708億ドルの資本支出予測からは、集中化は加速していることがわかる。一方、開発者の実際の利用パターンを見ると、供給側には未だに効果的に統合されていないリソースが多く存在している。このギャップこそ、分散型ネットワークが構造的に存在し得る余地だ。

Daniilは講演で、次の対比を引用した:2000年のインターネットバブル崩壊後、残ったのは廃墟ではなく、世界中に張り巡らされた光ファイバー網だった。それが、次の20年のデジタル経済を支えた。AIインフラ投資の熱狂が冷めた後に残るのは、計算力のプロトコルとインセンティブメカニズムだ。次のサイクルのインフラとなるだろう——ただし、どのプロトコルの根底のロジックが十分に堅固で、圧力下でも動き続けられるのか、という問題だ。

これは特定のプロジェクトの問題ではなく、分散型AIの全体が直面すべき課題だ:ガバナンス設計は、シングルポイントのコントロールを本当に防げるのか?インセンティブは、規模拡大後も有効なのか?計算力ネットワークの分散化は、技術的実行層、トークン発行層、アップグレード決定層の三つの次元で同時に成立するのか?

結び

DeepSeekの価格引き下げは、「AIの民主化」についてのナarrativeを再燃させた。しかし、推論呼び出しの民主化と、計算力インフラの民主化は異なる問題だ。前者は進行中だが、後者が実現するかどうかは、今後数年で何人が本気でこの課題をエンジニアリングの問題と捉えるかにかかっている。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン