BlockBeats のニュース、6月21日、GPU販売業者のTinygradは、信頼できる情報筋によると、GLM 5.2モデルは2台のネットワーク接続されたBlackwellアーキテクチャのtinybox上で毎秒120トークンの推論速度を実現できると発表しました。
この構成の価格は15万ドルで、標準のtinyboxを2台またはtinybox Proを1台選択でき、いずれも上記の性能を達成します。Tinygradはこれをセールスポイントとし、「一度購入、永遠にクラウド料金不要」のプライベート展開路線を打ち出し、従量課金のクラウド推論サービスに直接対抗しています。
現時点ではこの情報はGLM公式による確認を得ておらず、Tinygradも詳細な技術情報を公開していません。
下の原文リンクをクリックして、動察 Beating · Feishu AIニュースチャンネルに参加し、7×24時間体制で世界のAIホットトピックとニュースを監視しましょう。
1.05M 人気度
20.38M 人気度
60.71K 人気度
922.61K 人気度
2.07M 人気度
TinygradはGLM5.2がBlackwellの二台接続構成で120トークン/秒を実現できると称し、価格は15万ドル。
BlockBeats のニュース、6月21日、GPU販売業者のTinygradは、信頼できる情報筋によると、GLM 5.2モデルは2台のネットワーク接続されたBlackwellアーキテクチャのtinybox上で毎秒120トークンの推論速度を実現できると発表しました。
この構成の価格は15万ドルで、標準のtinyboxを2台またはtinybox Proを1台選択でき、いずれも上記の性能を達成します。Tinygradはこれをセールスポイントとし、「一度購入、永遠にクラウド料金不要」のプライベート展開路線を打ち出し、従量課金のクラウド推論サービスに直接対抗しています。
現時点ではこの情報はGLM公式による確認を得ておらず、Tinygradも詳細な技術情報を公開していません。
下の原文リンクをクリックして、動察 Beating · Feishu AIニュースチャンネルに参加し、7×24時間体制で世界のAIホットトピックとニュースを監視しましょう。