A ecologia AMD finalmente tem um modelo de linguagem de difusão competitivo, quanto foi economizado em cálculo com o movimento TiDAR

Ver original
MeNews
Zyphra lança o primeiro modelo de linguagem de difusão do ecossistema AMD, com uma aceleração máxima de 7,7 vezes
Zyphra lança ZAYA1-8B-Diffusion-Preview, transformando um grande modelo de linguagem autoregressivo em um modelo de difusão de especialistas híbridos, tornando-se o primeiro modelo de linguagem de difusão treinado no ecossistema de hardware AMD. Através do TiDAR, pula o pré-treinamento do zero, podendo denoizar simultaneamente 16 tokens em uma única passagem, transformando o gargalo de memória de vídeo em um gargalo de poder de processamento. Testes reais mostram uma aceleração de 4,6x com atenção CCA + amostragem sem perdas, aumentando para 7,7x após a troca para o amostrador de logit híbrido.
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado