208 vezes mais rápido + previsão de 5 microssegundos, rodando KMeans no H200 chega a 61% do pico de FLOPS, esse pessoal de Berkeley fez o Triton ficar incrível

Ver original
CoinNetwork
Aceleração máxima de 208 vezes com cuML, biblioteca de aceleração de ML clássica de código aberto, como FlashLib, da Universidade da Califórnia, Berkeley.
O site CoinWorld afirma que a biblioteca de aprendizado de máquina de código aberto FlashLib, divulgada pela OneMillion_AI, foi desenvolvida por equipes como a de Berkeley, cobrindo 15 operadores de alto nível, baseada em Triton e Cutedsl, alcançando aceleração significativa em operadores como KMeans e KNN na GPU H200, com até 208x de velocidade.
Em comparação com o cuML 25.10, KMeans 26x, KNN 19x, HDBSCAN 40x, TruncatedSVD 208x;
FLOPS de pico do KMeans atingem 61%, largura de banda do KNN é de 85,2%.
Além disso, o FlashLib também oferece uma API de previsão de desempenho em menos de 5 microssegundos, estimando o tempo de execução e o consumo de memória de vídeo, e o código já está de código aberto no GitHub.
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado