Mem0 publica investigación sobre arquitectura de memoria de larga duración: precisión un 26% superior a OpenAI, retraso en inferencia reducido en un 91%

robot
Generación de resúmenes en curso
ME News Noticias, 17 de abril (UTC+8), según Beating de Monitoreo de Dongcha, la plataforma de memoria AI personalizada Mem0 anunció recientemente los resultados de su algoritmo de memoria a largo plazo central. Los datos experimentales muestran que, en la prueba de referencia LOCOMO, la precisión de respuesta de Mem0 supera en un 26% a la función de memoria incorporada de OpenAI, y debido a su mecanismo de recuperación de "hechos", su latencia de inferencia P95 se reduce en un 91%, y el consumo de tokens disminuye en un 90%.
El problema central que resuelve este algoritmo es la "olvidad" de los agentes AI en interacciones de largo plazo. A diferencia de la ruta de ampliar simplemente la ventana de contexto de LLM de manera violenta, Mem0 adopta una tubería de procesamiento en dos etapas: en la "fase de extracción", el sistema extrae hechos clave de las conversaciones más recientes, resúmenes rodantes y registros históricos; en la "fase de actualización", el sistema realiza comparaciones con una base de datos vectorial, ejecutando operaciones de adición, actualización, eliminación, conflicto o ignorar, asegurando que la memoria sea eficiente y coherente.
La investigación también presenta una variante mejorada, Mem0ᵍ. Esta versión introduce una estructura de base de datos gráfica, transformando los hechos extraídos en nodos y bordes etiquetados, para capturar relaciones complejas entre entidades en múltiples sesiones. En entornos de producción reales, Mem0 puede completar todo el proceso desde la recuperación de memoria hasta la generación de respuestas en 0.71 segundos, mientras que el método tradicional de "todo el contexto" requiere casi 10 segundos.
Actualmente, este estudio ha sido aceptado en la Conferencia Europea de Inteligencia Artificial (ECAI), y el código relacionado ya está abierto en GitHub. (Fuente: BlockBeats)
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 7
  • 8
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
NightFlightMint
· hace4h
¿La extracción de hechos clave en dos etapas, en la primera etapa, puede perder información?
Ver originalResponder0
ApeWithNotes
· hace4h
De la memoria olvidadiza a la memoria a largo plazo, este punto débil está bien identificado
Ver originalResponder0
BorrowingBuddy
· hace4h
La latencia de P95 se redujo en un 91 %, y la optimización de la cola larga es más difícil que la latencia promedio
Ver originalResponder0
GateUser-f78f1f3e
· hace4h
¿La recuperación de memoria en 0.71 segundos puede soportar alta concurrencia en un entorno de producción?
Ver originalResponder0
MintColdBrew
· hace4h
Las relaciones de entidades entre sesiones usando bases de datos gráficas, esta dirección de mejora es muy inteligente
Ver originalResponder0
NightFlightPaperCrane
· hace4h
La memoria incorporada de OpenAI realmente es inútil, finalmente alguien la ha hecho en serio
Ver originalResponder0
GateUser-4bd1cc87
· hace4h
¿A qué escenario de prueba específico se refiere la diferencia del 26% entre LOCOMO de referencia y OpenAI?
Ver originalResponder0
  • Fijado