208-кратне прискорення + прогноз на 5 мікросекунд, запуск KMeans на H200 безпосередньо до 61% пікових FLOPS, ці хлопці з Берклі зробили з Triton справжній витвір мистецтва

Переглянути оригінал
CoinNetwork
Швидкість до 208 разів швидше за cuML, відкритий класичний бібліотека прискорення машинного навчання FlashLib від Каліфорнійського університету в Берклі та інших
Згідно з CoinWorld, відкритий бібліотечний швидкий машинного навчання FlashLib, розкритий OneMillion_AI, був розроблений командами з Берклі та інших, охоплює 15 високорівневих операторів, базується на Triton та Cutedsl, і забезпечує значне прискорення для операторів KMeans, KNN на GPU H200, до 208 разів. У порівнянні з cuML 25.10, KMeans у 26 разів швидше, KNN у 19 разів, HDBSCAN у 40 разів, TruncatedSVD у 208 разів; пікова продуктивність KMeans досягає 61% FLOPS, пропускна здатність KNN — 85,2%. Крім того, FlashLib також надає API для передбачення продуктивності за 5 мікросекунд, оцінює час виконання та використання відеопам’яті, код вже відкритий на GitHub.
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено