Microsoft vừa Thả một số thông số thú vị: cấu hình mới nhất của họ đạt được 15.200 token mỗi giây trên GPU Blackwell Ultra của NVDA. Đó là một bước nhảy vọt vững chắc 27% từ mức cơ bản trước đó là 12.022 token/s. Những cải tiến về hiệu suất ở đây có thể định hình lại chi phí hạ tầng AI trên toàn bộ.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
12 thích
Phần thưởng
12
4
Đăng lại
Retweed
Bình luận
0/400
TokenTaxonomist
· 6giờ trước
*thực ra* những con số đó cần được xác nhận phân loại học. Bảng tính của tôi gợi ý một chênh lệch hiệu suất không đáng kể về mặt thống kê khi được chuẩn hóa theo mức tiêu thụ năng lượng
Microsoft vừa Thả một số thông số thú vị: cấu hình mới nhất của họ đạt được 15.200 token mỗi giây trên GPU Blackwell Ultra của NVDA. Đó là một bước nhảy vọt vững chắc 27% từ mức cơ bản trước đó là 12.022 token/s. Những cải tiến về hiệu suất ở đây có thể định hình lại chi phí hạ tầng AI trên toàn bộ.