6月17日、GLM-5.2がオープンソース化。今回は違う。
MITライセンス：自由に改変、販売可能、唯一の義務は著作権表示の保持。
知的財産リスクゼロで、企業は安心してモデルを自社の商用製品に組み込める。改変しても提出義務なし。GPLのような「私のコードを使ったらオープンソースにしなければならない」といった感染性のあるライセンスと比べて、MITはハードルを下げている。
さらに重要なのは——すべてのモデルが、長距離推論の時代に突入したことだ。
GLM-5.2は一体何を変えたのか？
OpenClaw時代、エージェントの仕事は「短距離」——各タスクのウィンドウは限られ、計画-実行-終了、KVキャッシュの規模も制御可能、ハードウェアの負荷は主に計算能力に集中。
GLM-5.2の長距離推論は「マラソン」——100万トークンの損失なしのコンテキストを持ち、モデルは一つのタスク内で全てのコード、全ての意思決定履歴、全ての制約条件を保持できる。実際のテストでは88万トークンを一度に処理し、ほぼウィンドウいっぱいに使用。
この変化は何を意味するのか？
過去のAIは「一問一答」——トークンの消費は一回きりだった。
GLM-5.2以降、エージェントは本格的な長距離タスクを開始：目標の分解→多回の計画→反復検証→ツールの調整→コードを書いて実行→フィードバックに基づき再計画。1つのタスクで数百回の推論ループをトリガー。
各ループごとに、完全なコンテキストをメモリにロードして再計算。
継続的な計算、継続的な通信、継続的な読書と書き込み。
この3つの「継続」が、ハードウェアの価格設定ロジックを根本から変えた。
長距離エージェント推論は何に有利か？
🥇 HBM
KVキャッシュは対話のラウンド数とコンテキスト長に比例して増加し、GPUのHBM容量を急速に消耗。一度GPUのローカルを離れると、帯域幅はTB/s級から百GB/s級に低下——問題は「計算能力」から「メモリ帯域」に変わる。
三大メーカーの生産能力は売り切れ、需要ギャップは50%-60%、2026年の市場規模は546億ドル。
🥈 光チップ/InP
長距離推論はクラスター内で動作し、各ループごとにノード間の同期が必要。タスクが長くなるほど、ループが多くなるほど、通信量は恐ろしくなる。
光モジュールの2026年市場は260億ドル、年成長率60%。InP基板の不足は70%以上、インジウム価格は前年比90%上昇。
🥉 CPU
長距離タスクには継続的なタスク分解、ツール呼び出し、フロー管理、KVキャッシュのスケジューリングが必要。これらはGPUでは苦手で、CPUに頼る。
CPUとGPUの搭載比は1:8から1:1に近づき、インテルのCEOは公に「複数の企業のCEOがCPUの供給を催促の電話をかけてきている」と述べた。
❄️ 液冷散熱
短距離推論はパルス負荷だが、長距離推論は継続的にフル負荷。同じカードでも、長距離タスクの実際の消費電力は短距離推論の3-5倍。
ラックの電力消費は36kWから200kWに跳ね上がり、空冷では耐えられず、液冷は「選択肢」から「必須」へ。
🔌 スイッチ
推論クラスターの帯域要求は100Gから400Gに跳ね上がり、数十万のカードの調整が必要。IBや高速イーサネットが全ラインで恩恵を受ける。
📦 ABF基板
クラスターは千枚から万枚へ拡大し、各チップの封装が必要に。味の素が90%以上のABF膜を独占し、2028年には不足率42%に達する見込み。
小麦粉の値上がりで、パンはさらに高くなる。
🧪 CCL M9
推論クラスターのマザーボード、バックプレーンはすべて高速基材が必要。M9の単価は普通のFR4の10倍、2027年のAI用CCL市場は187億ドル、成長率は光モジュールを超える。
OpenClawは火をつけ、GLM-5.2は薪を提供した。
前者はモデル企業に最初のトークンの恩恵をもたらし、後者はこの市場を実験室から産業へと押し上げた。
単純な操作は依然としてストレージや光の中に立ち、AIバブルを享受している。
$MU $SKHYNIX $LITE

TOKEN3.06%

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。