CITIC Securities: A melhoria da capacidade de armazenamento torna-se na necessidade central do raciocínio de agentes inteligentes atuais. Mantemos uma visão otimista sobre a tendência de crescimento do armazenamento.

robot
Geração de resumo em curso

Notícias do Renmin Caixun a 31 de março: um relatório de pesquisa do Citic Securities afirma que a IA evolui de “conversa simples” para “agentes inteligentes (Agent)”, impulsionando um aumento acentuado do comprimento do contexto. De acordo com os dados da Epoch AI, a maior janela de contexto cresce aproximadamente 30x por ano; a capacidade de memória do KV Cache e o comprimento do contexto apresentam uma relação de crescimento linear, muito superior ao ritmo de evolução das configurações de hardware. Atualmente, os principais fabricantes de modelos em grande escala e os fabricantes de hardware resolvem as limitações de capacidade de computação sobretudo através de quantização, armazenamento em camadas e otimização da arquitetura dos modelos, mas isso ainda não altera a explosão da necessidade de memória. O Citic Securities considera que a otimização de memória poderá reduzir o custo de geração por token e, por conseguinte, estimular os utilizadores a iniciarem maior concorrência e contextos mais longos; a procura total de capacidade de computação não só não diminuirá como aumentará. A atualização da capacidade de computação tornar-se-á uma necessidade central do raciocínio por agentes no momento, e a equipa vê com convicção uma tendência de crescimento do armazenamento.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar