Tinygrad称GLM5.2可在双机互联Blackwell配置下跑出120tok/s,售价15万美元

robot
摘要生成中

BlockBeats 消息,6 月 21 日,GPU 销售商 Tinygrad 发文称,据可靠消息 GLM 5.2 模型在两台联网 Blackwell 架构 tinybox 上可实现每秒 120 个 token 的推理速度。

该配置售价 15 万美元,可选双台标准 tinybox 或单台 tinybox Pro,均可达到上述性能表现。Tinygrad 以此为卖点,主打「一次购买、永不付云费」的私有化部署路线,直接对标按需计费的云端推理服务。

目前该消息尚未经 GLM 官方证实,Tinygrad 亦未披露更多技术细节。


点击下方原文链接,加入动察 Beating · 飞书 AI 新闻渠道,7×24 小时不间断监测全球 AI 热点与新闻。

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论