Tinygrad稱GLM5.2可在雙機互聯Blackwell配置下跑出120tok/s,售價15萬美元

robot
摘要生成中

BlockBeats 消息,6 月 21 日,GPU 銷售商 Tinygrad 發文稱,據可靠消息 GLM 5.2 模型在兩台聯網 Blackwell 架構 tinybox 上可實現每秒 120 個 token 的推理速度。

該配置售價 15 萬美元,可選雙台標準 tinybox 或單台 tinybox Pro,均可達到上述性能表現。Tinygrad 以此為賣點,主打「一次購買、永不付雲費」的私有化部署路線,直接對標按需計費的雲端推理服務。

目前該消息尚未經 GLM 官方證實,Tinygrad 亦未披露更多技術細節。


點擊下方原文連結,加入動察 Beating · 飛書 AI 新聞渠道,7×24 小時不間斷監測全球 AI 熱點與新聞。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆