Mem0 publica pesquisa sobre arquitetura de memória de longa duração: precisão superior em 26% à OpenAI, atraso de raciocínio reduzido em 91%

robot
Geração de resumo em curso
Notícias ME, 17 de abril (UTC+8), de acordo com o monitoramento do Beating, a plataforma de memória AI personalizada Mem0 divulgou recentemente os resultados de sua pesquisa sobre o algoritmo de memória de longo prazo central. Os dados experimentais mostram que, no teste de referência LOCOMO, a taxa de precisão de resposta do Mem0 é 26% superior à função de memória embutida do OpenAI, e devido ao seu mecanismo de recuperação de "factualização", sua latência de inferência P95 foi reduzida em 91%, e o consumo de tokens diminuiu em 90%.
O problema central que esse algoritmo resolve é a "esquecimento" dos agentes de IA em interações de longo prazo. Diferentemente da abordagem de ampliar simplesmente a janela de contexto do LLM de forma agressiva, o Mem0 utiliza uma pipeline de processamento em duas etapas: na "fase de extração", o sistema extrai fatos-chave das conversas mais recentes, resumos rolantes e registros históricos; na "fase de atualização", o sistema compara com um banco de dados vetorial, executando operações de adição, atualização, exclusão de conflitos ou ignorando, garantindo que a memória seja enxuta e consistente.
A pesquisa também apresenta uma variante aprimorada, o Mem0ᵍ. Essa versão introduz uma estrutura de banco de dados gráfico, convertendo os fatos extraídos em nós e arestas rotulados, capturando relações complexas entre entidades em múltiplas sessões. Em ambientes de produção reais, o Mem0 consegue completar todo o processo de recuperação de memória até a geração de resposta em 0,71 segundos, enquanto o método tradicional de "todo o contexto" leva quase 10 segundos.
Atualmente, essa pesquisa foi aceita na Conferência Europeia de Inteligência Artificial (ECAI), e o código relacionado já está open source no GitHub. (Fonte: BlockBeats)
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • 7
  • 8
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
NightFlightMint
· 4h atrás
Ao extrair fatos-chave em duas fases, a primeira fase pode perder informações?
Ver originalResponder0
ApeWithNotes
· 4h atrás
De esquecimento à memória de longo prazo, este ponto problemático é bem identificado
Ver originalResponder0
BorrowingBuddy
· 4h atrás
A latência do P95 caiu 91%, a otimização da cauda longa é mais difícil do que a média de latência
Ver originalResponder0
GateUser-f78f1f3e
· 4h atrás
Recuperação de memória em 0,71 segundos, o ambiente de produção consegue suportar alta concorrência?
Ver originalResponder0
MintColdBrew
· 4h atrás
Relações de entidades entre sessões usando banco de dados de grafos, essa direção de aprimoramento é muito inteligente
Ver originalResponder0
NightFlightPaperCrane
· 4h atrás
A memória incorporada do OpenAI é realmente inútil, finalmente alguém fez algo sério a respeito
Ver originalResponder0
GateUser-4bd1cc87
· 4h atrás
Qual é o cenário de teste específico em que o LOCOMO supera o OpenAI em 26%?
Ver originalResponder0
  • Fixado