208 kali percepatan + prediksi 5 mikrodetik, menjalankan KMeans di H200 langsung mencapai 61% puncak FLOPS, orang-orang Berkeley ini membuat Triton jadi luar biasa

Lihat Asli
CoinNetwork
Kecepatan hingga 208 kali lipat dibandingkan dengan cuML, perpustakaan akselerasi ML klasik sumber terbuka seperti FlashLib dari University of California, Berkeley dan lainnya
Bijiwan menyatakan bahwa FlashLib, perpustakaan percepatan pembelajaran mesin sumber terbuka yang diungkapkan oleh OneMillion_AI, dikembangkan oleh tim dari Berkeley dan lainnya, mencakup 15 operator tingkat tinggi, berbasis Triton dan Cutedsl, dan mencapai percepatan signifikan pada GPU H200 untuk operator seperti KMeans dan KNN, dengan kecepatan hingga 208x. Dibandingkan dengan cuML 25.10, KMeans 26x, KNN 19x, HDBSCAN 40x, TruncatedSVD 208x; puncak FLOPS KMeans mencapai 61%, bandwidth KNN 85,2%. Selain itu, FlashLib juga menyediakan API prediksi kinerja dalam waktu kurang dari 5 mikrodetik, memperkirakan durasi eksekusi dan penggunaan memori GPU, dan kode sumbernya telah dipublikasikan di GitHub.
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan