Mem0 publie une recherche sur l'architecture de mémoire à long terme : une précision supérieure de 26 % à OpenAI, une latence d'inférence réduite de 91 %

robot
Création du résumé en cours
ME News Nouvelles, le 17 avril (UTC+8), selon le monitoring de Dongcha Beating, la plateforme de mémoire AI personnalisée Mem0 a récemment publié ses résultats de recherche sur son algorithme de mémoire à long terme central. Les données expérimentales montrent qu’en test de référence LOCOMO, la précision de réponse de Mem0 dépasse de 26 % celle de la fonction de mémoire intégrée d’OpenAI, et grâce à son mécanisme de recherche « factuelle », sa latence d’inférence P95 a été réduite de 91 %, et la consommation de tokens a diminué de 90 %.
L’algorithme résout le problème central de l’oubli chez les agents AI lors d’interactions prolongées. Contrairement à la simple extension de la fenêtre de contexte des LLM par une approche brute, Mem0 utilise une pipeline en deux étapes : lors de la « phase d’extraction », le système extrait des faits clés à partir des dialogues récents, des résumés défilants et de l’historique ; lors de la « phase de mise à jour », le système compare avec une base de données vectorielle, effectuant des opérations d’ajout, de mise à jour, de suppression de conflits ou d’ignorance, pour assurer la concision et la cohérence de la mémoire.
La recherche présente également une variante améliorée, Mem0ᵍ. Cette version introduit une structure de base de données graphique, transformant les faits extraits en nœuds et arêtes étiquetés, afin de capturer des relations complexes entre entités à travers plusieurs sessions. En environnement de production, Mem0 peut réaliser l’ensemble du processus de récupération de mémoire à la génération de réponse en 0,71 seconde, alors que la méthode « contexte complet » traditionnelle nécessite près de 10 secondes.
Actuellement, cette recherche a été acceptée par la conférence européenne sur l’intelligence artificielle (ECAI), et le code associé est open source sur GitHub. (Source : BlockBeats)
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 7
  • 8
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
NightFlightMint
· Il y a 5h
L'extraction de faits clés en deux étapes, la première étape risque-t-elle de perdre des informations ?
Voir l'originalRépondre0
ApeWithNotes
· Il y a 5h
De l'oubli à la mémoire à long terme, cette problématique est bien ciblée
Voir l'originalRépondre0
BorrowingBuddy
· Il y a 5h
P95 délai réduit de 91 %, l'optimisation de la longue traîne est plus difficile que la réduction de la moyenne des délais
Voir l'originalRépondre0
GateUser-f78f1f3e
· Il y a 5h
La recherche en mémoire prend 0,71 seconde, le environnement de production peut-il supporter une haute concurrence ?
Voir l'originalRépondre0
MintColdBrew
· Il y a 5h
L'utilisation d'une base de données graphique pour les relations d'entités inter-voies est une direction d'amélioration très intelligente
Voir l'originalRépondre0
NightFlightPaperCrane
· Il y a 5h
La mémoire intégrée d'OpenAI est vraiment peu pratique, enfin quelqu'un l'a prise au sérieux.
Voir l'originalRépondre0
GateUser-4bd1cc87
· Il y a 5h
Quel est le scénario de test spécifique où LOCOMO dépasse OpenAI de 26 % ?
Voir l'originalRépondre0
  • Épinglé