Δ-Mem:Memória online eficiente para grandes modelos de linguagem

robot
Geração de resumo em curso
ME News Notícias, 16 de maio (UTC+8), os pesquisadores propuseram o Δ-Mem, um sistema de memória online eficiente projetado especificamente para grandes modelos de linguagem. Este sistema reduz significativamente o uso de memória ao armazenar e atualizar apenas as mudanças incrementais nas ativações do modelo, em vez do estado completo das ativações. Os experimentos mostram que o Δ-Mem pode reduzir o uso de memória em até 70%, mantendo praticamente a mesma qualidade na saída do modelo. Este método ajuda a implantar e executar grandes modelos de linguagem em ambientes com recursos limitados, aumentando a viabilidade em cenários de inferência online e aprendizagem contínua. (Fonte: AiHot)
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • 6
  • 1
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
VineGeometry
· 3h atrás
Onde posso ver os dados do experimento? Quero ver a perda na tarefa específica.
Ver originalResponder0
AirdropMileCounter
· 3h atrás
Δ-Mem + quantização, será que consegue levar a memória de vídeo ao limite?
Ver originalResponder0
YieldSpring
· 3h atrás
A ideia de armazenamento incremental é genial, é um pouco como o cérebro humano que só lembra as partes que mudam.
Ver originalResponder0
DegenLibrarian
· 3h atrás
No cenário de aprendizagem contínua, pode haver problemas de erro acumulado?
Ver originalResponder0
PineLiquidityPool
· 3h atrás
Se isto for integrado ao vLLM, a capacidade de processamento vai disparar.
Ver originalResponder0
QuantitativeButNotPretentious
· 3h atrás
A queda de 70% na memória é incrível, os dispositivos de borda finalmente podem rodar grandes modelos
Ver originalResponder0
  • Fixado