广场
最新
热门
资讯
我的主页
发布
GateUser-1a2ed0b9
2026-06-27 19:21:46
关注
All In Podcast最新一期,几位大佬怎么看美光、存储瓶颈、中国开源模型和分布式推理
这期All In Podcast信息量挺大的,挑几个我觉得最值得分享的话题整理了一下。
先说中国开源模型这条线,进展比想象中快
智谱AI发布了新一代Frontier级开源模型GLM 5.2,7440亿参数,100万token上下文,彻底走MIT开源协议。评测数据挺惊人:在软件工程编程基准测试里击败了GPT-5.5,距离Anthropic最顶级的Claude Opus 4.8也只差不到1%,但API价格比同等性能的美国模型便宜了整整85%。
节目里有个细节很有意思,说的是中国团队加速追赶的一种方法:用成千上万台手机和iPad组成设备农场,用加密账户向美国顶级Frontier模型的API高密度提问,把对方的推理链路收割下来,喂给自己的开源模型做强化训练。这相当于把美国实验室耗费巨资跑出来的标准答案当成小抄,用很低的成本实现接近的性能。
Sacks对此的态度挺尖锐,他批评Anthropic的Dario之前推动美国政府设立繁琐的安全审批流程,这种自我设限反而拖慢了美国自己的节奏。Fable模型因为越狱指控被迫下架,OpenAI的新模型审批也很难产。他的判断是中国模型目前技术上落后大概9个月,芯片上落后大概24个月,但已经全线用华为昇腾这类本土芯片完成了GLM5家族的训练,未来这些针对本土芯片优化、便宜好用的"AI盒子"很可能会被低价倾销到全球市场,而美国自己却在设各种限制,反而把这个万亿级出口市场让出去了。
美光这次的财报,节目里给出了一个精准的定位:DRAM才是整个AI浪潮真正的卡脖子环节
美光这季度营收同比暴增四倍,从90亿飙升到420亿,指引远超预期,2026年的HBM产能早就全部售罄。
节目里有个观点说得挺直白:之前大家在推特上找各种日本小辅材公司当作"瓶颈股",但真正的命脉只有DRAM,尤其是HBM。原因很简单,内存的带宽和容量决定了所有大模型推理性能的物理天花板,这是个硬约束,绕不过去。甚至提到马斯克正在建设的超级工厂,技术核心也是对准DRAM,不是光纤、电源或者NAND闪存。
美光这次商业模式上也做了一个挺有意思的变化:跟核心云厂商签了带有"价格下限与上限"保护的长期供应协议,锁定了50%的未来营收。这意味着即便未来行业周期下行,最低合同保价也比过去任何一轮周期的毛利峰值还高。
进入壁垒这块,虽然中国的长鑫存储在筹备上市,未来可能会用低价中低端消费级内存缓解苹果这类大厂的成本压力,但在AI服务器需要的顶级HBM领域,全球目前还是只有美光、SK海力士、三星这三家能生产,工艺难度极高,不是短期能被追上的。
节目里给了一个挺夸张的预测:明年全球超大规模资本开支里,会有30%到40%直接流向DRAM芯片厂商。这种成本飙升已经导致苹果全线提高了MacBook和Mac Studio的零售价。
边缘计算和分布式推理这部分,是这期里最有想象力的内容,分享几个我觉得有意思的设想
特斯拉6月18日申请了一个叫"Megapod"的硬件商标。背后的物理逻辑是:在地面建一个1吉瓦的数据中心,土地、能耗、液冷的审批流程极其漫长。Megapod的设想是把GPU、电池网络和冷却系统集成进一个集装箱式的模块化数据中心,直接空降在已经获批、有现成电网和空闲土地的特斯拉超级充电站网络里,绕开传统数据中心建设最大的瓶颈——审批和电力接入。
分布式推理这条线的逻辑也挺有意思:模型回答问题可以拆成两个阶段,理解问题的Prefill阶段和高带宽高内存消耗的Decode阶段。大资金可以收购折旧的旧显卡,前端外挂专门做解码优化的芯片,组成成本更低的分布式推理网络。
更疯狂一点的设想是,未来给买家用储能电池Powerwall的用户提供折扣,强制在每个电池里内置AI芯片,再配合Starlink卫星连接,电池闲置的时候自动组成一个庞大的分布式P2P推理池,获得源源不断几乎免费的离岸算力。这个设想如果真的实现,对传统云大厂会是一次降维打击。
最疯狂的部分是太空算力。地面建1吉瓦数据中心需要350亿美元芯片成本加250亿美元冷却人工成本,还面临各种用地争议。但随着SpaceX的星舰实现完全可重复使用,把1吉瓦算力通过激光互联发射到太空轨道的成本可能暴降到只要50亿美元。太空天然的严寒环境和近乎无限的太阳能,可能让太空数据中心的运营经济学在3到4年内反超地表数据中心。
DRAM
-4.91%
SKHYNIX
-8.97%
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见
声明
。
赞赏
点赞
评论
转发
分享
评论
请输入评论内容
请输入评论内容
评论
暂无评论
热门话题
查看更多
#
0成本拿2股SK海力士
163.98万 热度
#
美光市值超越Meta跻身全美前十
48.34万 热度
#
南非VS加拿大
131.09万 热度
#
美国5月PCE通胀升至4.1%创三年新高
59.69万 热度
#
USD1链上质押享年化9.48%
100.24万 热度
置顶
网站地图
All In Podcast最新一期,几位大佬怎么看美光、存储瓶颈、中国开源模型和分布式推理
这期All In Podcast信息量挺大的,挑几个我觉得最值得分享的话题整理了一下。
先说中国开源模型这条线,进展比想象中快
智谱AI发布了新一代Frontier级开源模型GLM 5.2,7440亿参数,100万token上下文,彻底走MIT开源协议。评测数据挺惊人:在软件工程编程基准测试里击败了GPT-5.5,距离Anthropic最顶级的Claude Opus 4.8也只差不到1%,但API价格比同等性能的美国模型便宜了整整85%。
节目里有个细节很有意思,说的是中国团队加速追赶的一种方法:用成千上万台手机和iPad组成设备农场,用加密账户向美国顶级Frontier模型的API高密度提问,把对方的推理链路收割下来,喂给自己的开源模型做强化训练。这相当于把美国实验室耗费巨资跑出来的标准答案当成小抄,用很低的成本实现接近的性能。
Sacks对此的态度挺尖锐,他批评Anthropic的Dario之前推动美国政府设立繁琐的安全审批流程,这种自我设限反而拖慢了美国自己的节奏。Fable模型因为越狱指控被迫下架,OpenAI的新模型审批也很难产。他的判断是中国模型目前技术上落后大概9个月,芯片上落后大概24个月,但已经全线用华为昇腾这类本土芯片完成了GLM5家族的训练,未来这些针对本土芯片优化、便宜好用的"AI盒子"很可能会被低价倾销到全球市场,而美国自己却在设各种限制,反而把这个万亿级出口市场让出去了。
美光这次的财报,节目里给出了一个精准的定位:DRAM才是整个AI浪潮真正的卡脖子环节
美光这季度营收同比暴增四倍,从90亿飙升到420亿,指引远超预期,2026年的HBM产能早就全部售罄。
节目里有个观点说得挺直白:之前大家在推特上找各种日本小辅材公司当作"瓶颈股",但真正的命脉只有DRAM,尤其是HBM。原因很简单,内存的带宽和容量决定了所有大模型推理性能的物理天花板,这是个硬约束,绕不过去。甚至提到马斯克正在建设的超级工厂,技术核心也是对准DRAM,不是光纤、电源或者NAND闪存。
美光这次商业模式上也做了一个挺有意思的变化:跟核心云厂商签了带有"价格下限与上限"保护的长期供应协议,锁定了50%的未来营收。这意味着即便未来行业周期下行,最低合同保价也比过去任何一轮周期的毛利峰值还高。
进入壁垒这块,虽然中国的长鑫存储在筹备上市,未来可能会用低价中低端消费级内存缓解苹果这类大厂的成本压力,但在AI服务器需要的顶级HBM领域,全球目前还是只有美光、SK海力士、三星这三家能生产,工艺难度极高,不是短期能被追上的。
节目里给了一个挺夸张的预测:明年全球超大规模资本开支里,会有30%到40%直接流向DRAM芯片厂商。这种成本飙升已经导致苹果全线提高了MacBook和Mac Studio的零售价。
边缘计算和分布式推理这部分,是这期里最有想象力的内容,分享几个我觉得有意思的设想
特斯拉6月18日申请了一个叫"Megapod"的硬件商标。背后的物理逻辑是:在地面建一个1吉瓦的数据中心,土地、能耗、液冷的审批流程极其漫长。Megapod的设想是把GPU、电池网络和冷却系统集成进一个集装箱式的模块化数据中心,直接空降在已经获批、有现成电网和空闲土地的特斯拉超级充电站网络里,绕开传统数据中心建设最大的瓶颈——审批和电力接入。
分布式推理这条线的逻辑也挺有意思:模型回答问题可以拆成两个阶段,理解问题的Prefill阶段和高带宽高内存消耗的Decode阶段。大资金可以收购折旧的旧显卡,前端外挂专门做解码优化的芯片,组成成本更低的分布式推理网络。
更疯狂一点的设想是,未来给买家用储能电池Powerwall的用户提供折扣,强制在每个电池里内置AI芯片,再配合Starlink卫星连接,电池闲置的时候自动组成一个庞大的分布式P2P推理池,获得源源不断几乎免费的离岸算力。这个设想如果真的实现,对传统云大厂会是一次降维打击。
最疯狂的部分是太空算力。地面建1吉瓦数据中心需要350亿美元芯片成本加250亿美元冷却人工成本,还面临各种用地争议。但随着SpaceX的星舰实现完全可重复使用,把1吉瓦算力通过激光互联发射到太空轨道的成本可能暴降到只要50亿美元。太空天然的严寒环境和近乎无限的太阳能,可能让太空数据中心的运营经济学在3到4年内反超地表数据中心。