Tăng tốc 208 lần + dự đoán 5 micro giây, chạy KMeans trên H200 trực tiếp đạt 61% đỉnh FLOPS, nhóm Berkeley đã làm Triton trở nên phong phú hơn

Xem bản gốc
CoinNetwork
Tăng tốc tối đa 208 lần so với cuML, thư viện tăng tốc ML kinh điển mã nguồn mở FlashLib của Đại học California, Berkeley và các trường khác
Trang web của Coinjie cho biết, thư viện tăng tốc học máy mã nguồn mở FlashLib do nhóm Berkeley và các nhóm khác phát triển, bao gồm 15 toán tử cấp cao, dựa trên Triton và Cutedsl, đạt tốc độ đáng kể trên GPU H200 cho các toán tử như KMeans, KNN, đạt tối đa 208x. So với cuML 25.10, KMeans 26x, KNN 19x, HDBSCAN 40x, TruncatedSVD 208x; tối đa FLOPS của KMeans đạt 61%, băng thông của KNN đạt 85.2%. Ngoài ra, FlashLib còn cung cấp API dự đoán hiệu suất trong vòng 5 microgiây, ước lượng thời gian chạy và tiêu thụ bộ nhớ GPU, mã nguồn đã mở trên GitHub.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim