Equipe de He Kai Ming ELF: o modelo de difusão de linguagem finalmente foi executado

robot
Geração do resumo em andamento

De acordo com o monitoramento Beating, a equipe de He Kaiming do MIT lançou o modelo de difusão de linguagem ELF (Embedded Language Flows). Ele não segue a rota autoregressiva do tipo GPT de “prever o próximo token”, mas sim coloca a geração de texto no espaço de embedding contínuo, até a última etapa, quando então é convertido de volta para tokens discretos.

Modelos de difusão já estão maduros na geração de imagens, mas aplicá-los a textos sempre foi estranho: imagens são sinais contínuos por natureza, enquanto a linguagem é composta por tokens discretos. Antes, muitos modelos de difusão contínua para texto precisavam inserir supervisionamento em nível de token repetidamente durante a trajetória de geração, ou precisavam de decodificadores independentes adicionais. A abordagem do ELF é mais limpa: a maior parte das etapas realiza apenas denoising no espaço vetorial contínuo, e na última etapa um rede de peso compartilhado realiza a discretização.

Os resultados experimentais também são impactantes. Na avaliação de geração não condicionada do OpenWebText, o ELF-B com 105 milhões de parâmetros atingiu aproximadamente 24,1 de Gen. PPL em 32 passos de amostragem, superando várias linhas de base de modelos de difusão de linguagem discretos e contínuos. Mais importante, o ELF-B usou apenas cerca de 45 bilhões de tokens de treinamento, enquanto métodos comparativos geralmente ultrapassam 500 bilhões, ou seja, o treinamento usou cerca de uma ordem de magnitude a menos de tokens. Esse resultado pelo menos indica que a rota de difusão contínua não foi bloqueada pela “discretidade da linguagem”; problemas anteriores provavelmente estavam na interface de modelagem e no design de amostragem.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado