208 veces más rápido + predicción en 5 microsegundos, ejecutando KMeans en H200 directamente hasta el 61% del pico de FLOPS, esta gente de Berkeley ha llevado Triton a otro nivel

Ver original
CoinNetwork
Hasta 208 veces más rápido que cuML, la biblioteca de aceleración de ML clásica de código abierto FlashLib de la Universidad de California, Berkeley, y otros.
El sitio web de CoinWorld afirma que la biblioteca de aceleración de aprendizaje automático de código abierto FlashLib, revelada por OneMillion_AI, fue desarrollada por equipos como Berkeley y otros, cubriendo 15 operadores de alto nivel, basada en Triton y Cutedsl, logrando una aceleración significativa en GPU H200 para operadores como KMeans y KNN, con un máximo de 208x. En comparación con cuML 25.10, KMeans 26x, KNN 19x, HDBSCAN 40x, TruncatedSVD 208x; el pico de FLOPS de KMeans alcanza el 61%, y el ancho de banda de KNN es del 85.2%. Además, FlashLib también ofrece una API de predicción de rendimiento en menos de 5 microsegundos, que estima la duración de ejecución y el consumo de memoria de video, y el código ya está abierto en GitHub.
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado