广场
最新
热门
资讯
我的主页
发布
Roger波杰克
2026-06-21 06:36:04
关注
OpenClaw让模型公司第一次尝到了Token经济的甜头。
6月17日,GLM-5.2开源。这次不一样。
MIT协议:随便改、随便卖、唯一义务保留版权声明。
知识产权风险清零,企业可以放心把模型嵌入自己的商业产品,改了也不用交出来。对比GPL那种"用了我的代码你也得开源"的传染性协议,MIT等于把门槛拆了。
更关键的是——所有的模型,从此进入长推理时代。
GLM-5.2到底改变了什么?
OpenClaw时代,Agent干活是"短跑"——每次任务窗口有限,规划-执行-结束,KV Cache规模可控,硬件压力主要在算力。
GLM-5.2的长程推理是"马拉松"——1M无损上下文,模型可以在一次任务中持有全部代码、全部决策历史、全部约束条件。实际测试中一次处理88万tokens,几乎用满窗口。
这个改变意味着什么?
过去AI是"一问一答",Token消耗一次就结束。
GLM-5.2之后,Agent开始跑真正的长程任务:分解目标→多轮规划→反复验证→调工具→写代码再跑代码→根据反馈重新规划。一个任务触发数百次推理循环。
每一次循环,都要把完整的上下文载入内存重新计算。
持续计算、持续通信、持续读写。
这三个"持续",彻底改变了硬件的定价逻辑。
长程Agent推理,到底利好什么?
🥇 HBM
KV Cache随对话轮次和上下文长度线性增长,快速耗尽GPU HBM容量。一旦KV Cache离开GPU本地,带宽从TB/s级下探到百GB/s级——问题从"算力"变成了"内存带宽"。
三大厂产能售罄,缺口50%-60%,2026年市场规模546亿美元。
🥈 光芯片/InP
长程推理跑在集群里,每一次循环都需要卡间同步。任务越长、循环越多,通信量越恐怖。
光模块2026年市场260亿美元,年增60%。InP衬底缺口70%+,铟价同比涨90%。
🥉 CPU
长程任务需要持续的任务拆解、工具调用、流程管理、KV Cache调度。这些活GPU干不好,得靠CPU。
CPU/GPU搭载比例从1:8趋近1:1,英特尔CEO公开说"多家公司CEO打电话催货CPU"。
❄️ 液冷散热
短推理是脉冲式负载,长程推理是持续满载。同样一张卡,长程任务的实际能耗是短推理的3-5倍。
机柜功耗从36kW跳到200kW,风冷扛不住,液冷从"备选"变"必选"。
🔌 交换机
推理集群带宽需求从100G跳400G,几十万张卡需要调度。IB和高速以太网全线受益。
📦 ABF载板
集群从千卡扩万卡,每颗芯片都要封装。味之素垄断90%+ ABF膜,2028年缺口42%。
面粉涨价,面包只会更贵。
🧪 CCL M9
推理集群的主板、背板,全都要高速基材。M9单价是普通FR4的10倍,2027年AI CCL市场187亿美元,增速超光模块。
OpenClaw点燃了火,GLM-5.2提供了柴。
前者让模型公司赚到了第一桶Token,后者让这个市场从实验室走向了产业。
简单的操作还是站在存储里,站在光里,享受AI泡沫。
$MU $SKHYNIX $LITE
TOKEN
4.28%
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见
声明
。
赞赏
点赞
评论
转发
分享
评论
请输入评论内容
请输入评论内容
评论
暂无评论
热门话题
查看更多
#
gStocks代币化股票上线
450.3万 热度
#
非农爆冷打压加息预期
104.01万 热度
#
预测世界杯阿根廷VS佛得角
19.52万 热度
#
ETH突破1700
1.52亿 热度
#
Meta卖算力引发存储股大跌
139.35万 热度
置顶
网站地图
OpenClaw让模型公司第一次尝到了Token经济的甜头。
6月17日,GLM-5.2开源。这次不一样。
MIT协议:随便改、随便卖、唯一义务保留版权声明。
知识产权风险清零,企业可以放心把模型嵌入自己的商业产品,改了也不用交出来。对比GPL那种"用了我的代码你也得开源"的传染性协议,MIT等于把门槛拆了。
更关键的是——所有的模型,从此进入长推理时代。
GLM-5.2到底改变了什么?
OpenClaw时代,Agent干活是"短跑"——每次任务窗口有限,规划-执行-结束,KV Cache规模可控,硬件压力主要在算力。
GLM-5.2的长程推理是"马拉松"——1M无损上下文,模型可以在一次任务中持有全部代码、全部决策历史、全部约束条件。实际测试中一次处理88万tokens,几乎用满窗口。
这个改变意味着什么?
过去AI是"一问一答",Token消耗一次就结束。
GLM-5.2之后,Agent开始跑真正的长程任务:分解目标→多轮规划→反复验证→调工具→写代码再跑代码→根据反馈重新规划。一个任务触发数百次推理循环。
每一次循环,都要把完整的上下文载入内存重新计算。
持续计算、持续通信、持续读写。
这三个"持续",彻底改变了硬件的定价逻辑。
长程Agent推理,到底利好什么?
🥇 HBM
KV Cache随对话轮次和上下文长度线性增长,快速耗尽GPU HBM容量。一旦KV Cache离开GPU本地,带宽从TB/s级下探到百GB/s级——问题从"算力"变成了"内存带宽"。
三大厂产能售罄,缺口50%-60%,2026年市场规模546亿美元。
🥈 光芯片/InP
长程推理跑在集群里,每一次循环都需要卡间同步。任务越长、循环越多,通信量越恐怖。
光模块2026年市场260亿美元,年增60%。InP衬底缺口70%+,铟价同比涨90%。
🥉 CPU
长程任务需要持续的任务拆解、工具调用、流程管理、KV Cache调度。这些活GPU干不好,得靠CPU。
CPU/GPU搭载比例从1:8趋近1:1,英特尔CEO公开说"多家公司CEO打电话催货CPU"。
❄️ 液冷散热
短推理是脉冲式负载,长程推理是持续满载。同样一张卡,长程任务的实际能耗是短推理的3-5倍。
机柜功耗从36kW跳到200kW,风冷扛不住,液冷从"备选"变"必选"。
🔌 交换机
推理集群带宽需求从100G跳400G,几十万张卡需要调度。IB和高速以太网全线受益。
📦 ABF载板
集群从千卡扩万卡,每颗芯片都要封装。味之素垄断90%+ ABF膜,2028年缺口42%。
面粉涨价,面包只会更贵。
🧪 CCL M9
推理集群的主板、背板,全都要高速基材。M9单价是普通FR4的10倍,2027年AI CCL市场187亿美元,增速超光模块。
OpenClaw点燃了火,GLM-5.2提供了柴。
前者让模型公司赚到了第一桶Token,后者让这个市场从实验室走向了产业。
简单的操作还是站在存储里,站在光里,享受AI泡沫。
$MU $SKHYNIX $LITE