TinygradはGLM5.2がBlackwellの二台接続構成で120トークン/秒を実現できると称し、価格は15万ドル。

robot
概要作成中

BlockBeats のニュース、6月21日、GPU販売業者のTinygradは、信頼できる情報筋によると、GLM 5.2モデルは2台のネットワーク接続されたBlackwellアーキテクチャのtinybox上で毎秒120トークンの推論速度を実現できると発表しました。

この構成の価格は15万ドルで、標準のtinyboxを2台またはtinybox Proを1台選択でき、いずれも上記の性能を達成します。Tinygradはこれをセールスポイントとし、「一度購入、永遠にクラウド料金不要」のプライベート展開路線を打ち出し、従量課金のクラウド推論サービスに直接対抗しています。

現時点ではこの情報はGLM公式による確認を得ておらず、Tinygradも詳細な技術情報を公開していません。


下の原文リンクをクリックして、動察 Beating · Feishu AIニュースチャンネルに参加し、7×24時間体制で世界のAIホットトピックとニュースを監視しましょう。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン留め