2026-06-21 04:33:19
Tinygrad 报告称 GLM 5.2 在双 Blackwell 配置上实现 120 tokens/秒,投入 15 万美元
据 BlockBeats 称,6 月 21 日,Tinygrad 报告称,GLM 5.2 在双网络的 Blackwell 架构 tinybox 配置上实现了每秒 120 tokens 的推理速度。15 万美元的配置可选两台标准 tinybox 设备或一台 tinybox Pro。Tinygrad 将该方案定位为面向云端推理服务的私有部署替代方案,并配有标语“buy once, never pay cloud fees again.”。GLM 尚未正式确认这些性能说法。