这期All In Podcast信息量挺大的，挑几个我觉得最值得分享的话题整理了一下。
先说中国开源模型这条线，进展比想象中快
智谱AI发布了新一代Frontier级开源模型GLM 5.2，7440亿参数，100万token上下文，彻底走MIT开源协议。评测数据挺惊人：在软件工程编程基准测试里击败了GPT-5.5，距离Anthropic最顶级的Claude Opus 4.8也只差不到1%，但API价格比同等性能的美国模型便宜了整整85%。
节目里有个细节很有意思，说的是中国团队加速追赶的一种方法：用成千上万台手机和iPad组成设备农场，用加密账户向美国顶级Frontier模型的API高密度提问，把对方的推理链路收割下来，喂给自己的开源模型做强化训练。这相当于把美国实验室耗费巨资跑出来的标准答案当成小抄，用很低的成本实现接近的性能。
Sacks对此的态度挺尖锐，他批评Anthropic的Dario之前推动美国政府设立繁琐的安全审批流程，这种自我设限反而拖慢了美国自己的节奏。Fable模型因为越狱指控被迫下架，OpenAI的新模型审批也很难产。他的判断是中国模型目前技术上落后大概9个月，芯片上落后大概24个月，但已经全线用华为昇腾这类本土芯片完成了GLM5家族的训练，未来这些针对本土芯片优化、便宜好用的"AI盒子"很可能会被低价倾销到全球市场，而美国自己却在设各种限制，反而把这个万亿级出口市场让出去了。
美光这次的财报，节目里给出了一个精准的定位：DRAM才是整个AI浪潮真正的卡脖子环节
美光这季度营收同比暴增四倍，从90亿飙升到420亿，指引远超预期，2026年的HBM产能早就全部售罄。
节目里有个观点说得挺直白：之前大家在推特上找各种日本小辅材公司当作"瓶颈股"，但真正的命脉只有DRAM，尤其是HBM。原因很简单，内存的带宽和容量决定了所有大模型推理性能的物理天花板，这是个硬约束，绕不过去。甚至提到马斯克正在建设的超级工厂，技术核心也是对准DRAM，不是光纤、电源或者NAND闪存。
美光这次商业模式上也做了一个挺有意思的变化：跟核心云厂商签了带有"价格下限与上限"保护的长期供应协议，锁定了50%的未来营收。这意味着即便未来行业周期下行，最低合同保价也比过去任何一轮周期的毛利峰值还高。
进入壁垒这块，虽然中国的长鑫存储在筹备上市，未来可能会用低价中低端消费级内存缓解苹果这类大厂的成本压力，但在AI服务器需要的顶级HBM领域，全球目前还是只有美光、SK海力士、三星这三家能生产，工艺难度极高，不是短期能被追上的。
节目里给了一个挺夸张的预测：明年全球超大规模资本开支里，会有30%到40%直接流向DRAM芯片厂商。这种成本飙升已经导致苹果全线提高了MacBook和Mac Studio的零售价。
边缘计算和分布式推理这部分，是这期里最有想象力的内容，分享几个我觉得有意思的设想
特斯拉6月18日申请了一个叫"Megapod"的硬件商标。背后的物理逻辑是：在地面建一个1吉瓦的数据中心，土地、能耗、液冷的审批流程极其漫长。Megapod的设想是把GPU、电池网络和冷却系统集成进一个集装箱式的模块化数据中心，直接空降在已经获批、有现成电网和空闲土地的特斯拉超级充电站网络里，绕开传统数据中心建设最大的瓶颈——审批和电力接入。
分布式推理这条线的逻辑也挺有意思：模型回答问题可以拆成两个阶段，理解问题的Prefill阶段和高带宽高内存消耗的Decode阶段。大资金可以收购折旧的旧显卡，前端外挂专门做解码优化的芯片，组成成本更低的分布式推理网络。
更疯狂一点的设想是，未来给买家用储能电池Powerwall的用户提供折扣，强制在每个电池里内置AI芯片，再配合Starlink卫星连接，电池闲置的时候自动组成一个庞大的分布式P2P推理池，获得源源不断几乎免费的离岸算力。这个设想如果真的实现，对传统云大厂会是一次降维打击。
最疯狂的部分是太空算力。地面建1吉瓦数据中心需要350亿美元芯片成本加250亿美元冷却人工成本，还面临各种用地争议。但随着SpaceX的星舰实现完全可重复使用，把1吉瓦算力通过激光互联发射到太空轨道的成本可能暴降到只要50亿美元。太空天然的严寒环境和近乎无限的太阳能，可能让太空数据中心的运营经济学在3到4年内反超地表数据中心。

DRAM-4.91%

SKHYNIX-8.97%

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

赞赏
点赞
评论
转发
分享

请输入评论内容

暂无评论

置顶

All In Podcast最新一期，几位大佬怎么看美光、存储瓶颈、中国开源模型和分布式推理

热门话题

0成本拿2股SK海力士

美光市值超越Meta跻身全美前十

南非VS加拿大

美国5月PCE通胀升至4.1%创三年新高

USD1链上质押享年化9.48%

置顶