6月17日，GLM-5.2開源。這次不一樣。
MIT協議：隨便改、隨便賣、唯一義務保留版權聲明。
知識產權風險清零，企業可以放心把模型嵌入自己的商業產品，改了也不用交出來。對比GPL那種"用了我的代碼你也得開源"的傳染性協議，MIT等於把門檻拆了。
更關鍵的是——所有的模型，從此進入長推理時代。
GLM-5.2到底改變了什麼？
OpenClaw時代，Agent幹活是"短跑"——每次任務窗口有限，規劃-執行-結束，KV Cache規模可控，硬體壓力主要在算力。
GLM-5.2的長程推理是"馬拉松"——1M無損上下文，模型可以在一次任務中持有全部代碼、全部決策歷史、全部約束條件。實際測試中一次處理88萬tokens，幾乎用滿窗口。
這個改變意味著什麼？
過去AI是"一問一答"，Token消耗一次就結束。
GLM-5.2之後，Agent開始跑真正的長程任務：分解目標→多輪規劃→反覆驗證→調工具→寫代碼再跑代碼→根據反饋重新規劃。一個任務觸發數百次推理循環。
每一次循環，都要把完整的上下文載入內存重新計算。
持續計算、持續通信、持續讀寫。
這三個"持續"，徹底改變了硬體的定價邏輯。
長程Agent推理，到底利好什麼？
🥇 HBM
KV Cache隨對話輪次和上下文長度線性增長，快速耗盡GPU HBM容量。一旦KV Cache離開GPU本地，帶寬從TB/s級下探到百GB/s級——問題從"算力"變成了"內存帶寬"。
三大廠產能售罄，缺口50%-60%，2026年市場規模546億美元。
🥈 光晶片/InP
長程推理跑在集群裡，每一次循環都需要卡間同步。任務越長、循環越多，通信量越恐怖。
光模組2026年市場260億美元，年增60%。InP衬底缺口70%+，銦價同比漲90%。
🥉 CPU
長程任務需要持續的任務拆解、工具調用、流程管理、KV Cache調度。這些活GPU幹不好，得靠CPU。
CPU/GPU搭載比例從1:8趨近1:1，英特爾CEO公開說"多家公司CEO打電話催貨CPU"。
❄️ 液冷散熱
短推理是脈衝式負載，長程推理是持續滿載。同樣一張卡，長程任務的實際能耗是短推理的3-5倍。
機櫃功耗從36kW跳到200kW，風冷扛不住，液冷從"備選"變"必選"。
🔌 交換機
推理集群帶寬需求從100G跳400G，幾十萬張卡需要調度。IB和高速以太網全線受益。
📦 ABF載板
集群從千卡擴萬卡，每顆芯片都要封裝。味之素壟斷90%+ ABF膜，2028年缺口42%。
面粉漲價，麵包只會更貴。
🧪 CCL M9
推理集群的主板、背板，全都要高速基材。M9單價是普通FR4的10倍，2027年AI CCL市場187億美元，增速超光模組。
OpenClaw點燃了火，GLM-5.2提供了柴。
前者讓模型公司賺到了第一桶Token，後者讓這個市場從實驗室走向了產業。
簡單的操作還是站在存儲裡，站在光裡，享受AI泡沫。
$MU $SKHYNIX $LITE

TOKEN2.71%

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

打賞
按讚
回覆
轉發
分享

回覆

請輸入回覆內容

暫無回覆

熱門話題
查看更多
#
gStocks代幣化股票上線
450.3萬熱度
#
非農爆冷打壓加息預期
104.01萬熱度
#
預測世界盃葡萄牙VS克羅地亞
19.52萬熱度
#
ETH突破1700
1.52億熱度
#
Meta賣算力引發存儲股大跌
139.35萬熱度

已置頂

OpenClaw讓模型公司第一次嚐到了Token經濟的甜頭。

熱門話題

gStocks代幣化股票上線

非農爆冷打壓加息預期

預測世界盃葡萄牙VS克羅地亞

ETH突破1700

Meta賣算力引發存儲股大跌

已置頂