英伟达发布Blackwell成本明细:GPU贵一倍,每token便宜35倍

robot
摘要生成中

币界网消息,英伟达发布了关于其Blackwell系列的成本明细,指出GPU成本比上一代贵一倍,但每token成本却便宜35倍。根据英伟达的博客,评估推理基础设施时应关注「每token成本」而非「每GPU每小时成本」。以deepseek-r1(MOE推理模型)为测试对象,Blackwell(GB300 NVL72)与上一代Hopper(HGX H200)进行对比。按云市场租赁参考价,Blackwell每GPU每小时2.65美元,较Hopper的1.41美元贵近一倍,但单GPU每秒token产出从90跳到6000,提升65倍,分摊后每百万token成本从4.20美元降至0.12美元。需要注意的是,0.12美元的成本是基于FP4低精度推理和多token预测等多项软件优化开启的前提下得出的。

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论