Tinygrad cho biết GLM5.2 có thể đạt 120 token/giây trong cấu hình kết nối hai máy Blackwell, giá bán 150.000 USD

robot
Đang tạo bản tóm tắt

BlockBeats Tin nhắn, ngày 21 tháng 6, nhà bán GPU Tinygrad đã đăng bài cho biết, theo nguồn đáng tin cậy, mô hình GLM 5.2 có thể thực hiện tốc độ suy luận 120 token mỗi giây trên hai máy Tinybox kết nối mạng dựa trên kiến trúc Blackwell.

Cấu hình này có giá 150.000 USD, có thể chọn hai máy Tinybox tiêu chuẩn hoặc một máy Tinybox Pro, đều đạt được hiệu suất trên. Tinygrad lấy điểm mạnh này làm điểm bán hàng, tập trung vào phương thức triển khai riêng tư "mua một lần, không bao giờ trả phí đám mây", cạnh tranh trực tiếp với dịch vụ suy luận trên đám mây theo mô hình tính phí theo nhu cầu.

Hiện tại, thông tin này chưa được xác nhận chính thức bởi GLM, Tinygrad cũng chưa tiết lộ thêm chi tiết kỹ thuật nào khác.


Nhấn vào liên kết nguyên bản bên dưới để tham gia kênh tin tức AI của Động Chấn Beating · Feishu, theo dõi liên tục 24/7 các điểm nóng và tin tức AI toàn cầu.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim