广场
最新
热门
资讯
我的主页
发布
torygreen
2026-06-25 10:51:03
关注
关于AI计算的分化,很少有人正在用正确方式读懂它。
前沿训练每个季度都在更加集中:数千块GPU必须放在同一个地方,并用线缆连成一体。但在2026年,训练只占需求的30%。其余70%是推理,而在hyperscaler(超大规模云)上运行推理,意味着你要为那种为最苛刻工作负载建造的基础设施付费,却用来做最简单的任务。
在分布式网络上,同样的推理本可以便宜45%到75%,而对任何在测算AI基础设施预算的人来说,这个差距就是全部故事。
训练出于必要性而集中;推理则被拆分,因为当你不再需要为一个不需要AWS利润率的工作负载支付这些利润率时,在规模上这样做就不再说得通。
查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见
声明
。
赞赏
点赞
评论
转发
分享
评论
请输入评论内容
请输入评论内容
评论
暂无评论
热门话题
查看更多
#
0成本拿2股SK海力士
148.63万 热度
#
BTC下探60000美元关键关口
3.78亿 热度
#
美国VS土耳其
29.49万 热度
#
TradFiCFD黄金大师赛
218.53万 热度
#
USD1链上质押享年化9.48%
96.9万 热度
置顶
网站地图
关于AI计算的分化,很少有人正在用正确方式读懂它。
前沿训练每个季度都在更加集中:数千块GPU必须放在同一个地方,并用线缆连成一体。但在2026年,训练只占需求的30%。其余70%是推理,而在hyperscaler(超大规模云)上运行推理,意味着你要为那种为最苛刻工作负载建造的基础设施付费,却用来做最简单的任务。
在分布式网络上,同样的推理本可以便宜45%到75%,而对任何在测算AI基础设施预算的人来说,这个差距就是全部故事。
训练出于必要性而集中;推理则被拆分,因为当你不再需要为一个不需要AWS利润率的工作负载支付这些利润率时,在规模上这样做就不再说得通。