廣場
最新
熱門
新聞
我的主頁
發布
Roger波杰克
2026-06-21 06:36:04
關注
OpenClaw讓模型公司第一次嚐到了Token經濟的甜頭。
6月17日,GLM-5.2開源。這次不一樣。
MIT協議:隨便改、隨便賣、唯一義務保留版權聲明。
知識產權風險清零,企業可以放心把模型嵌入自己的商業產品,改了也不用交出來。對比GPL那種"用了我的代碼你也得開源"的傳染性協議,MIT等於把門檻拆了。
更關鍵的是——所有的模型,從此進入長推理時代。
GLM-5.2到底改變了什麼?
OpenClaw時代,Agent幹活是"短跑"——每次任務窗口有限,規劃-執行-結束,KV Cache規模可控,硬體壓力主要在算力。
GLM-5.2的長程推理是"馬拉松"——1M無損上下文,模型可以在一次任務中持有全部代碼、全部決策歷史、全部約束條件。實際測試中一次處理88萬tokens,幾乎用滿窗口。
這個改變意味著什麼?
過去AI是"一問一答",Token消耗一次就結束。
GLM-5.2之後,Agent開始跑真正的長程任務:分解目標→多輪規劃→反覆驗證→調工具→寫代碼再跑代碼→根據反饋重新規劃。一個任務觸發數百次推理循環。
每一次循環,都要把完整的上下文載入內存重新計算。
持續計算、持續通信、持續讀寫。
這三個"持續",徹底改變了硬體的定價邏輯。
長程Agent推理,到底利好什麼?
🥇 HBM
KV Cache隨對話輪次和上下文長度線性增長,快速耗盡GPU HBM容量。一旦KV Cache離開GPU本地,帶寬從TB/s級下探到百GB/s級——問題從"算力"變成了"內存帶寬"。
三大廠產能售罄,缺口50%-60%,2026年市場規模546億美元。
🥈 光晶片/InP
長程推理跑在集群裡,每一次循環都需要卡間同步。任務越長、循環越多,通信量越恐怖。
光模組2026年市場260億美元,年增60%。InP衬底缺口70%+,銦價同比漲90%。
🥉 CPU
長程任務需要持續的任務拆解、工具調用、流程管理、KV Cache調度。這些活GPU幹不好,得靠CPU。
CPU/GPU搭載比例從1:8趨近1:1,英特爾CEO公開說"多家公司CEO打電話催貨CPU"。
❄️ 液冷散熱
短推理是脈衝式負載,長程推理是持續滿載。同樣一張卡,長程任務的實際能耗是短推理的3-5倍。
機櫃功耗從36kW跳到200kW,風冷扛不住,液冷從"備選"變"必選"。
🔌 交換機
推理集群帶寬需求從100G跳400G,幾十萬張卡需要調度。IB和高速以太網全線受益。
📦 ABF載板
集群從千卡擴萬卡,每顆芯片都要封裝。味之素壟斷90%+ ABF膜,2028年缺口42%。
面粉漲價,麵包只會更貴。
🧪 CCL M9
推理集群的主板、背板,全都要高速基材。M9單價是普通FR4的10倍,2027年AI CCL市場187億美元,增速超光模組。
OpenClaw點燃了火,GLM-5.2提供了柴。
前者讓模型公司賺到了第一桶Token,後者讓這個市場從實驗室走向了產業。
簡單的操作還是站在存儲裡,站在光裡,享受AI泡沫。
$MU $SKHYNIX $LITE
TOKEN
2.71%
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見
聲明
。
打賞
按讚
回覆
轉發
分享
回覆
請輸入回覆內容
請輸入回覆內容
回覆
暫無回覆
熱門話題
查看更多
#
gStocks代幣化股票上線
450.3萬 熱度
#
非農爆冷打壓加息預期
104.01萬 熱度
#
預測世界盃葡萄牙VS克羅地亞
19.52萬 熱度
#
ETH突破1700
1.52億 熱度
#
Meta賣算力引發存儲股大跌
139.35萬 熱度
已置頂
網站地圖
OpenClaw讓模型公司第一次嚐到了Token經濟的甜頭。
6月17日,GLM-5.2開源。這次不一樣。
MIT協議:隨便改、隨便賣、唯一義務保留版權聲明。
知識產權風險清零,企業可以放心把模型嵌入自己的商業產品,改了也不用交出來。對比GPL那種"用了我的代碼你也得開源"的傳染性協議,MIT等於把門檻拆了。
更關鍵的是——所有的模型,從此進入長推理時代。
GLM-5.2到底改變了什麼?
OpenClaw時代,Agent幹活是"短跑"——每次任務窗口有限,規劃-執行-結束,KV Cache規模可控,硬體壓力主要在算力。
GLM-5.2的長程推理是"馬拉松"——1M無損上下文,模型可以在一次任務中持有全部代碼、全部決策歷史、全部約束條件。實際測試中一次處理88萬tokens,幾乎用滿窗口。
這個改變意味著什麼?
過去AI是"一問一答",Token消耗一次就結束。
GLM-5.2之後,Agent開始跑真正的長程任務:分解目標→多輪規劃→反覆驗證→調工具→寫代碼再跑代碼→根據反饋重新規劃。一個任務觸發數百次推理循環。
每一次循環,都要把完整的上下文載入內存重新計算。
持續計算、持續通信、持續讀寫。
這三個"持續",徹底改變了硬體的定價邏輯。
長程Agent推理,到底利好什麼?
🥇 HBM
KV Cache隨對話輪次和上下文長度線性增長,快速耗盡GPU HBM容量。一旦KV Cache離開GPU本地,帶寬從TB/s級下探到百GB/s級——問題從"算力"變成了"內存帶寬"。
三大廠產能售罄,缺口50%-60%,2026年市場規模546億美元。
🥈 光晶片/InP
長程推理跑在集群裡,每一次循環都需要卡間同步。任務越長、循環越多,通信量越恐怖。
光模組2026年市場260億美元,年增60%。InP衬底缺口70%+,銦價同比漲90%。
🥉 CPU
長程任務需要持續的任務拆解、工具調用、流程管理、KV Cache調度。這些活GPU幹不好,得靠CPU。
CPU/GPU搭載比例從1:8趨近1:1,英特爾CEO公開說"多家公司CEO打電話催貨CPU"。
❄️ 液冷散熱
短推理是脈衝式負載,長程推理是持續滿載。同樣一張卡,長程任務的實際能耗是短推理的3-5倍。
機櫃功耗從36kW跳到200kW,風冷扛不住,液冷從"備選"變"必選"。
🔌 交換機
推理集群帶寬需求從100G跳400G,幾十萬張卡需要調度。IB和高速以太網全線受益。
📦 ABF載板
集群從千卡擴萬卡,每顆芯片都要封裝。味之素壟斷90%+ ABF膜,2028年缺口42%。
面粉漲價,麵包只會更貴。
🧪 CCL M9
推理集群的主板、背板,全都要高速基材。M9單價是普通FR4的10倍,2027年AI CCL市場187億美元,增速超光模組。
OpenClaw點燃了火,GLM-5.2提供了柴。
前者讓模型公司賺到了第一桶Token,後者讓這個市場從實驗室走向了產業。
簡單的操作還是站在存儲裡,站在光裡,享受AI泡沫。
$MU $SKHYNIX $LITE