Meta lança método de aceleração BLT, reduzindo a largura de banda da memória em até 92%

AIMPACT mensagem, 12 de maio (UTC+8), equipes de pesquisa do Meta, Universidade de Stanford e Universidade de Washington recentemente lançaram três novos métodos que aceleram significativamente a velocidade de inferência do Byte Latent Transformer (BLT). BLT é um modelo de linguagem que opera diretamente em bytes brutos, agrupando bytes dinamicamente em patches de comprimento variável usando uma estratégia de divisão baseada em entropia, correspondendo ao desempenho de modelos baseados em tokenização. Como a decodificação autoregressiva byte a byte exige múltiplas passagens para frente, a largura de banda de memória se torna o principal gargalo. Os três métodos de aceleração são os seguintes: BLT-D usa difusão discreta em blocos, treinando com previsão do próximo byte e perda de previsão de bytes mascarados, gerando múltiplos bytes por passagem, com tamanho de bloco 4, a largura de banda de memória é menor que metade do BLT, e com tamanho de bloco 16, reduz de 87-92%; BLT-S utiliza um decodificador local leve como um rascunho especulativo, sem necessidade de treinamento adicional, produzindo resultados idênticos ao BLT padrão sob decodificação gananciosa, podendo reduzir 77% da largura de banda de memória; BLT-DV combina rascunho difuso com validação autoregressiva, usando os mesmos pesos do modelo bidirecionalmente, reduzindo a largura de banda de memória em 81%. Todos os métodos trazem maior benefício em tarefas de tradução, enquanto tarefas de codificação são mais sensíveis ao tamanho do bloco. Nos testes de benchmark baseados em probabilidade, como ARC-Easy, ARC-Challenge, PIQA, HellaSwag, MMLU, o pontuação do BLT-D se aproxima do baseline do BLT, mantendo a robustez na capacidade de inferência.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado