NVIDIA and Alibaba Revalue AI, Throwing FLOPS into the "Garbage Bin"
→日本語訳:

エヌビディアとアリババがAIを再評価、FLOPSを「ゴミ箱に捨てる」

3月17日、黄仁勋はNVIDIA GTC 2026の舞台で、象徴的なジャケットを着て2時間以上にわたり講演を行った。会後、ほぼ全ネットで「NVIDIAはトークンの王者になる」と話題になった。

しかし、もしこの講演を注意深く聴けば、黄仁勋が本当に繰り返し強調していたのは、トークンそのものではなく、「Tokens per Watt(ワットあたりのトークン数)」であることに気づく。彼は推論性能のグラフを示す際にこの概念を明確に述べ、はっきりと語った:データセンターやAI工場は本質的に電力に制約されており、1GWの工場が2GWに拡大することは物理法則によって不可能だと。固定された出力で、誰のワットあたりのトークン生産が最も高いか、誰の生産コストが最も低いか、そして誰の収益曲線が最も急か、これが重要だ。

この言葉こそが、GTC 2026全体の真の焦点である。

世論はVera RubinがBlackwellより何倍優れているか、Groq LPXが推論速度を35倍向上させること、NVIDIAがデータセンターを宇宙に持ち出すことに熱中している。これらも確かに重要だが、本質的にはすべて同じ論理の異なる表現:エネルギー制約の下で、ワットあたりの知能出力を最大化することだ。

黄仁勋が「Tokens/W」をAI工場の出力を測る核心尺度として掲げた背景には、さらに重要な産業の深意がある。計算能力の競争指標が、チップからシステムへ、ピークパラメータからエンドツーエンドの効率へと移行しつつある。誰のチップが速いかではなく、誰がエネルギーを知能に変換する効率が高いかを競う時代になっている。

現状の製品・技術のマトリックスの中で、NVIDIAと黄仁勋はまだtoken/wの制約に縛られており、真のトークン王者への道のりは遠い。

これは「知能の計測言語」の移行であり、その移行によって開かれる産業の視野は、どんな新しいチップよりも深く議論される価値がある。

幸運なことに、GTCの正式開幕の前日に、AlibabaはAlibaba Token Hubを発表し、呉泳銘が直接指揮をとった。AlibabaのAIの核心は、AIと名付けるのではなく、Tokenと名付け、TokenをAlibabaのAI戦略の高みへと引き上げた。

これもまた、システムの視点からAIを見ることが、業界の新たな認識になりつつあることの表れだ。これこそが本稿で強調したい理念であり、本稿の意義でもある。

01 GTC2026で最も注目すべき変化は、チップそのものではない

GTC 2026では、依然としてVera Rubin、Rubin POD、LPX、DSX AI Factoryといった新製品や新用語に注目が集まる。しかし、これらを一緒に見ると、計算能力の競争の枠組みが、単一のチップから計算インフラ全体へと拡大していることがわかる。つまり、計算、ネットワーク、ストレージ、電力、冷却、制御システム、ソフトウェアからなるAI工場全体のシステムの話だ。

RubinはPOD規模のプラットフォームとされ、複数のラックが協調して大規模なシステムを構成。DSXはAI工場向けのリファレンス設計と定義され、最大化すべきはワットあたりのトークン数だ。

これにより、業界の本当の競争は、単一のチップの性能から、システム全体の強さへと移行していることが示されている。より詳細には、有限の電力、冷却、ネットワークリソースをいかに効率的に組織し、安定したAI出力を実現できるかの勝負だ。

具体的な測定単位は、「ワットあたりのトークン数(Token/W)」である。

本稿では、このTokens/Wという尺度を通じて、今回の発表の意義と、AIインフラ産業の発展におけるチャンスを洞察したい。

02 システムに競争対象が変われば、測定体系もチップの枠を超える必要がある

チップ時代の測定体系には馴染みが深い。ピーク性能のFLOPS、メモリ帯域、FLOPS/W、TOPS/W、bit/Jなどの指標は、各部品の能力の限界を示すために重要だ。

しかし、実際には、次のような困った状況も生じている。知能計算センターには、客観的で統一された、かつ汎用的な測定単位が存在しない。

一般的に、データセンターの規模を測るにはMWの電力単位を使うが、中国国内の知能計算センターでは、PFlops(FP16基準)を用いている。しかし、同じ算力や電力のクラスターでも、内部のチップ、ネットワーク、冷却方式が異なれば、効率も大きく異なる。

理由は単純で、従来の測定単位は特定の次元だけを評価していたからだ。ピーク性能はチップの理論的計算能力を示し、bit/Jは局所的なデータ移動のエネルギー効率、帯域はサブシステム間の情報伝達能力を表す。これらはすべて、チップの特定の次元での評価だ。

しかし、最終的にAIシステムが答えるべき問いは、:固定の電力予算、冷却条件、施設制約のもとで、どれだけ有効なAI結果を出せるかだ。この問いには、チップ単体の指標だけでは答えられない。

NVIDIAの今回の発言から見えるのは、「token cost(コスト)」「ワットあたりのスループット」「ワットあたりのトークン性能」「Token/W」などの指標だ。

測定言語は、部品指向からシステム指向へと移行している。

したがって、従来のチップの評価指標であるピーク性能、帯域、bit/Jに対し、システムレベルのより合理的な尺度は「Token/W」である。前者は部品の能力を示し、後者は全体の産出を示す。前者は局所最適、後者はシステム最適を表す。

03 Token/Wはエネルギーから知能産出までの連鎖をつなぐ

NVIDIAのGTC 2026の現場資料では、トークンは現代AIの基本単位とされている。この表現は非常に的を射ている。大規模言語モデルや推論サービス、エージェントシステムにとって、最終的にユーザーが支払うのは、システムがトークンを生成・処理する能力そのものだ。

ビジネス運営の観点から見ると、トークンには3つの利点がある:1)モデル推論と直接結びついている。2)収益モデルと直接結びついている。3)推論時代の新負荷に適応できる。

エージェント、多輪対話、長文コンテキスト、検索強化、ツール呼び出し、推論チェーンなどの新負荷は、単一のFLOPSでは表現しづらいが、トークン、レイテンシ、良品率の観点では明確に影響を与える。

さらに重要なのは、今日のAIインフラの根底にある制約が、ますますエネルギー制約に直結していることだ。IEAの「Energy and AI」報告によると、2030年までに世界のデータセンターの電力消費は約945TWhに増加し、現在より大きく伸びる見込みだ。AIはその主要な推進要因の一つであり、米国はこの増加の大部分を占めると予測されている。言い換えれば、AI産業の今後の多くの課題は、表面上はチップの問題に見えるが、実質的には電力、冷却、インフラの組織の問題だ。

Token/Wの概念は価値がある。それは、AI産業の最も核心的な連鎖をつなぐからだ:電力入力から計算、ネットワーク、ストレージ、スケジューリング、冷却を経て、最終的にトークンの産出へとつながる。

この意味で、Token/Wは単なるFLOPS/Wやbit/Jの代替ではなく、見落とされがちな視点を補完するものだ。

すなわち、AIシステムがどれだけのエネルギーを知能に変換したかを示す尺度だ。

私の見解では、このGTCで最も議論すべきポイントはまさにここにあり、芯片を孤立させず、システムに、産業の制約の中に組み込んで考える必要がある。

これこそ、筆者が長らく提唱してきた視点だ。AIチップを見る際には、ピーク性能やメモリ帯域、インターフェースだけでなく、ネットワークでの協調、ラック内の配置、キャンパス内の電力供給、顧客側のコスト構造、最終的なビジネス成果まで見据える必要がある。

GTC 2026は、ある意味でこのシステム視点を公開的に証明したとも言える。NVIDIA自身がAI factoryを中心に語り始めた今、業界はAI計算チップ中心主義から計算システム中心主義へと移行している。

これは非常に重要なポイントだ。多くの産業は初期段階で部品パラメータに夢中になるが、部品の性能だけでは勝負にならない。大規模展開の段階では、システムの組織能力が勝敗を決める。今日のAIインフラは、その段階に到達している。

04 Token/Wの推移とともに、光インターコネクトの重要性が顕著に高まる

測定体系がシステムレベルに移行すれば、従来の付随的とされていた要素の価値も高まる。

その代表例が光インターコネクトだ。

従来、光インターコネクトの議論は、光モジュール、通信、デバイスの視点が中心だった。より高帯域、遠距離伝送、低pJ/bit、密度向上、挿損低減といった内容だ。これらは重要だが、これらの言葉は依然としてコンポーネントやチップのレベルにとどまっている。

しかし、Token/Wの枠組みでは、光インターコネクトの価値はより直感的になる。データ移動のエネルギーコストを削減し、大規模AI計算システムが電力をトークンに変換する能力を高める役割だ。

NVIDIAの光ネットワーク製品について述べると、光子を用いたCPOは、光モジュールより最大5倍のエネルギー効率を実現し、遅延も低減し、より大規模なAI工場の拡張を支える。

この表現のポイントは、単に通信技術の進歩だけでなく、システム規模の拡大とシステム効率の向上にある。

産業の論理から見れば、理解しやすい。モデルが巨大化し、コンテキストが長くなり、クラスターが拡大するほど、多くのエネルギー消費は演算ユニットではなく、データの移動やクロスチップ、クロスボード、クロスラックの通信に集中する。

この段階では、Token/Wを向上させるには、より効率的なインターコネクトが必要となる。GPUの性能向上だけでは不十分だ。

したがって、Token/Wの観点から、光インターコネクトの推進は、単なる先端技術のためではなく、大規模AIシステムの省エネ手段として必要不可欠になっている。

05 光計算は光インターコネクトより先端だが、その論理も成立し始めている

光計算は光インターコネクトよりも早期の技術だが、その点は正直に認める必要がある。

汎用性、精度、コンパイラ、製造の一貫性、システム統合といった課題は依然として進化中だ。しかし、システムレベルの視点に立てば、その産業的意義は過去よりも明確に語れる。

理由は、Token/Wがエンドツーエンドのエネルギー効率に関心を持つからだ。特定の高頻度・高密度・再マッピング可能な計算パスで、エネルギー消費を明らかに抑えることができれば、システムレベルでのトークン産出効率を向上させるチャンスが生まれる。この論理は、光計算がGPUの代替になることや、すぐに汎用計算の基盤になることを求めていない。

必要なのは一つだけ:特定の重要な負荷において、システム全体のJ/tokenを下げ、固定電力予算内でのトークン産出を向上させることだ。

これが、光計算のストーリーが、単一デバイスの効率からシステム全体の省エネ貢献へとシフトすべき理由だ。もし業界がTOPS/WやMAC/Jだけを見ているなら、それは実験室の話に過ぎない。しかし、Token/Wを見始めれば、インフラの議論に入るチャンスが生まれる。

この変化は、特に光計算にとって重要だ。なぜなら、これにより、顧客やキャンパス、電力、資本支出と対話できる上位言語を持てるからだ。

06 計算能力の測定がシステムへと移行すれば、光インターコネクトと光計算は産業の主流に

従来、計算能力の競争が主にチップレベルにとどまっていた時代、光インターコネクトはI/O技術、光計算は先端デバイスの探索に過ぎなかった。

しかし、計算能力の競争がAI大規模システムインフラへと移行すれば、状況は一変する。システムの効率は、密集した計算のエネルギー消費、データ移動、コンテキスト管理、ノード間協調、電力と熱管理の組織にますます依存する。これらの要素こそ、光学が最も力を発揮できる場所だ。

Token/Wの観点から見れば、光インターコネクトは、各トークン生成の背後にある搬送電力を解決し、光計算は、各トークンの背後にある計算電力の一部を書き換えようとする。両者は、システム全体のトークン産出効率に共同で影響を与える。

これが、彼らが産業の主流に進む根本的な理由だ。

より現実的に言えば、今後のデータセンターやAI工場が直面する制約は、チップの供給だけでなく、電力網の接続、冷却、キャンパスのエネルギー消費、ラックの電力密度、投資スピードも含まれる。国際エネルギー機関のAIのエネルギー消費に関する見解や、今回のNVIDIAのAI工場に関する表現も、同じ方向を指している。すなわち、AIインフラはエネルギーを用いたシステム工学へと変貌しつつある。

この新たな方向性を見据えれば、光インターコネクトと光計算が解決するのは、AI時代にますます高価になり、従来の電気的最適化が難しくなる部分、すなわちデータ移動のエネルギーコストと高密度計算の単位エネルギー消費だ。

これらは、より完全なシステム思考を反映している。そして、これが今回のGTC 2026で再び光子とシリコン光技術に焦点を当てた理由だ。

計算能力の測定がシステムに移行すれば、光学は先端技術の選択肢から、産業インフラの基盤へと進化していく。

この観点から、CPOと光計算システムは、未来に大きな期待が持てる。

最後に:AGI推進の主軸

著者は日常の仕事の中で、客観的かつ測定可能な計算能力の尺度を提唱し続けており、Tokens/Wの手法を用いてさまざまなチップの性能評価も行っている。

歴史を振り返ると、内燃機関の出力エネルギーと重量比が高まるほど、自動車は誕生し、飛行機は飛び立ち、ロケットは宇宙へと飛び立った。

そしてAI時代においては、AIシステムの出力結果(今はToken)とエネルギー消費の比重が高まるほど、知能はより賢くなり、AGIの誕生も近づく。

今回のGTC2026で本当に記憶すべきは、NVIDIAの栄光や黄仁勋が「Tokenの王者」になるかどうかではなく、新たな計測尺度の明確化だ。

さらに進めて言えば、NVIDIAやAlibaba、そして多くの業界大手は、システム思考の視点からAI産業の発展を見つめ始めている。

これは人類文明の主軸と一致している。それは、より少ないエネルギーで、より多くの情報を収集・伝送・処理することだ。

AGIも例外ではない!

本文出典:腾讯科技

リスク提示および免責条項

市場にはリスクが伴い、投資は慎重に行う必要がある。本稿は個人投資の助言を意図したものではなく、特定の投資目的や財務状況、ニーズを考慮したものではない。読者は本稿の意見、見解、結論が自身の状況に適合するかどうかを判断し、投資の責任は自己負担とする。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • 人気の Gate Fun

    もっと見る
  • 時価総額:$0.1保有者数:1
    0.00%
  • 時価総額:$0.1保有者数:0
    0.00%
  • 時価総額:$2.41K保有者数:2
    0.00%
  • 時価総額:$2.4K保有者数:1
    0.00%
  • 時価総額:$0.1保有者数:0
    0.00%
  • ピン