6月17日，GLM-5.2开源。这次不一样。
MIT协议：随便改、随便卖、唯一义务保留版权声明。
知识产权风险清零，企业可以放心把模型嵌入自己的商业产品，改了也不用交出来。对比GPL那种"用了我的代码你也得开源"的传染性协议，MIT等于把门槛拆了。
更关键的是——所有的模型，从此进入长推理时代。
GLM-5.2到底改变了什么？
OpenClaw时代，Agent干活是"短跑"——每次任务窗口有限，规划-执行-结束，KV Cache规模可控，硬件压力主要在算力。
GLM-5.2的长程推理是"马拉松"——1M无损上下文，模型可以在一次任务中持有全部代码、全部决策历史、全部约束条件。实际测试中一次处理88万tokens，几乎用满窗口。
这个改变意味着什么？
过去AI是"一问一答"，Token消耗一次就结束。
GLM-5.2之后，Agent开始跑真正的长程任务：分解目标→多轮规划→反复验证→调工具→写代码再跑代码→根据反馈重新规划。一个任务触发数百次推理循环。
每一次循环，都要把完整的上下文载入内存重新计算。
持续计算、持续通信、持续读写。
这三个"持续"，彻底改变了硬件的定价逻辑。
长程Agent推理，到底利好什么？
🥇 HBM
KV Cache随对话轮次和上下文长度线性增长，快速耗尽GPU HBM容量。一旦KV Cache离开GPU本地，带宽从TB/s级下探到百GB/s级——问题从"算力"变成了"内存带宽"。
三大厂产能售罄，缺口50%-60%，2026年市场规模546亿美元。
🥈 光芯片/InP
长程推理跑在集群里，每一次循环都需要卡间同步。任务越长、循环越多，通信量越恐怖。
光模块2026年市场260亿美元，年增60%。InP衬底缺口70%+，铟价同比涨90%。
🥉 CPU
长程任务需要持续的任务拆解、工具调用、流程管理、KV Cache调度。这些活GPU干不好，得靠CPU。
CPU/GPU搭载比例从1:8趋近1:1，英特尔CEO公开说"多家公司CEO打电话催货CPU"。
❄️ 液冷散热
短推理是脉冲式负载，长程推理是持续满载。同样一张卡，长程任务的实际能耗是短推理的3-5倍。
机柜功耗从36kW跳到200kW，风冷扛不住，液冷从"备选"变"必选"。
🔌 交换机
推理集群带宽需求从100G跳400G，几十万张卡需要调度。IB和高速以太网全线受益。
📦 ABF载板
集群从千卡扩万卡，每颗芯片都要封装。味之素垄断90%+ ABF膜，2028年缺口42%。
面粉涨价，面包只会更贵。
🧪 CCL M9
推理集群的主板、背板，全都要高速基材。M9单价是普通FR4的10倍，2027年AI CCL市场187亿美元，增速超光模块。
OpenClaw点燃了火，GLM-5.2提供了柴。
前者让模型公司赚到了第一桶Token，后者让这个市场从实验室走向了产业。
简单的操作还是站在存储里，站在光里，享受AI泡沫。
$MU $SKHYNIX $LITE

TOKEN4.28%

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

赞赏
点赞
评论
转发
分享

请输入评论内容

暂无评论

热门话题
查看更多
#
gStocks代币化股票上线
450.3万热度
#
非农爆冷打压加息预期
104.01万热度
#
预测世界杯阿根廷VS佛得角
19.52万热度
#
ETH突破1700
1.52亿热度
#
Meta卖算力引发存储股大跌
139.35万热度

置顶

OpenClaw让模型公司第一次尝到了Token经济的甜头。

热门话题

gStocks代币化股票上线

非农爆冷打压加息预期

预测世界杯阿根廷VS佛得角

ETH突破1700

Meta卖算力引发存储股大跌

置顶