关于AI计算的分化,很少有人正在用正确方式读懂它。


前沿训练每个季度都在更加集中:数千块GPU必须放在同一个地方,并用线缆连成一体。但在2026年,训练只占需求的30%。其余70%是推理,而在hyperscaler(超大规模云)上运行推理,意味着你要为那种为最苛刻工作负载建造的基础设施付费,却用来做最简单的任务。
在分布式网络上,同样的推理本可以便宜45%到75%,而对任何在测算AI基础设施预算的人来说,这个差距就是全部故事。
训练出于必要性而集中;推理则被拆分,因为当你不再需要为一个不需要AWS利润率的工作负载支付这些利润率时,在规模上这样做就不再说得通。
查看原文
post-image
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论