Mem0 publica pesquisa sobre arquitetura de memória de longa duração: precisão 26% superior à OpenAI, atraso de raciocínio reduzido em 91%

robot
Geração do resumo em andamento
ME News Notícias, 17 de abril (UTC+8), de acordo com o monitoramento do Beating, a plataforma de memória AI personalizada Mem0 divulgou recentemente os resultados de sua pesquisa sobre o algoritmo de memória de longo prazo central. Os dados experimentais mostram que, no teste de referência LOCOMO, a taxa de precisão de resposta do Mem0 é 26% maior do que a função de memória embutida do OpenAI, e devido ao seu mecanismo de recuperação de "fatos", seu atraso de inferência P95 foi reduzido em 91%, e o consumo de tokens diminuiu em 90%. O problema central que esse algoritmo resolve é a "esquecimento" do agente de IA em interações de longo prazo. Diferentemente da abordagem de ampliar simplesmente a janela de contexto do LLM, o Mem0 utiliza uma pipeline de processamento em duas etapas: na "fase de extração", o sistema extrai fatos-chave das conversas mais recentes, resumos rolantes e registros históricos; na "fase de atualização", o sistema compara com um banco de dados vetorial, executando operações de adição, atualização, exclusão de conflitos ou ignorando, garantindo que a memória seja eficiente e consistente. A pesquisa também apresenta uma variante aprimorada, o Mem0ᵍ. Essa versão introduz uma estrutura de banco de dados de grafos, convertendo os fatos extraídos em nós e arestas rotulados, capturando relações complexas de entidades entre múltiplas sessões. Em ambientes de produção reais, o Mem0 consegue completar todo o processo de recuperação de memória até a geração de resposta em 0,71 segundos, enquanto o método tradicional de "todo o contexto" leva quase 10 segundos. Atualmente, essa pesquisa foi aceita na Conferência Europeia de Inteligência Artificial (ECAI), e o código relacionado já está open source no GitHub. (Fonte: BlockBeats)
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • 7
  • 8
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
NightFlightMint
· 4h atrás
Na primeira fase de extração de fatos-chave, há risco de perda de informações?
Ver originalResponder0
ApeWithNotes
· 4h atrás
De esquecimento à memória de longo prazo, esse ponto problemático foi bem identificado
Ver originalResponder0
BorrowingBuddy
· 4h atrás
Atraso do P95 caiu 91%, a otimização da cauda longa é mais difícil do que a média de atraso
Ver originalResponder0
GateUser-f78f1f3e
· 4h atrás
Recuperação de memória em 0,71 segundos, o ambiente de produção consegue suportar alta concorrência?
Ver originalResponder0
MintColdBrew
· 4h atrás
Relacionamentos de entidades entre sessões usando banco de dados de grafos, essa direção de aprimoramento é muito inteligente
Ver originalResponder0
NightFlightPaperCrane
· 4h atrás
A memória embutida do OpenAI realmente é inútil, finalmente alguém fez algo sério a respeito
Ver originalResponder0
GateUser-4bd1cc87
· 4h atrás
Qual é o cenário de teste específico em que o LOCOMO Benchmark supera o OpenAI em 26%?
Ver originalResponder0
  • Fixado