Mem0 publica investigación sobre algoritmos de memoria a largo plazo centrales: mediante una canalización de dos etapas para extraer hechos clave y actualizar la memoria, evitando el olvido. En la referencia LOCOMO, la precisión es un 26% mayor que la memoria incorporada de OpenAI, la latencia de razonamiento P95 se reduce en un 91%, y el consumo de tokens disminuye en un 90%. La variante mejorada Mem0ᵍ introduce una base de datos gráfica para capturar relaciones de entidades entre sesiones. Desde la recuperación de memoria hasta la respuesta en producción, solo toma 0.71 segundos, muy por debajo de los casi 10 segundos del contexto completo. La investigación ha sido aceptada en ECAI y el código ya está abierto en GitHub.

MeNews

2026-05-21 19:55:18

Generación de resúmenes en curso

ME News Noticias, 17 de abril (UTC+8), según Beating de Monitoreo de Dongcha, la plataforma de memoria AI personalizada Mem0 anunció recientemente los resultados de su algoritmo de memoria a largo plazo central. Los datos experimentales muestran que, en la prueba de referencia LOCOMO, la precisión de respuesta de Mem0 supera en un 26% a la función de memoria incorporada de OpenAI, y debido a su mecanismo de recuperación de "hechos", su latencia de inferencia P95 se reduce en un 91%, y el consumo de tokens disminuye en un 90%.
El problema central que resuelve este algoritmo es la "olvidad" de los agentes AI en interacciones de largo plazo. A diferencia de la ruta de ampliar simplemente la ventana de contexto de LLM de manera violenta, Mem0 adopta una tubería de procesamiento en dos etapas: en la "fase de extracción", el sistema extrae hechos clave de las conversaciones más recientes, resúmenes rodantes y registros históricos; en la "fase de actualización", el sistema realiza comparaciones con una base de datos vectorial, ejecutando operaciones de adición, actualización, eliminación, conflicto o ignorar, asegurando que la memoria sea eficiente y coherente.
La investigación también presenta una variante mejorada, Mem0ᵍ. Esta versión introduce una estructura de base de datos gráfica, transformando los hechos extraídos en nodos y bordes etiquetados, para capturar relaciones complejas entre entidades en múltiples sesiones. En entornos de producción reales, Mem0 puede completar todo el proceso desde la recuperación de memoria hasta la generación de respuestas en 0.71 segundos, mientras que el método tradicional de "todo el contexto" requiere casi 10 segundos.
Actualmente, este estudio ha sido aceptado en la Conferencia Europea de Inteligencia Artificial (ECAI), y el código relacionado ya está abierto en GitHub. (Fuente: BlockBeats)

Ver original

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

10 me gusta

Recompensa
10
7
8
Compartir

Comentar

Añadir un comentario

NightFlightMint

· hace4h

¿La extracción de hechos clave en dos etapas, en la primera etapa, puede perder información?

Ver originalResponder0

ApeWithNotes

· hace4h

De la memoria olvidadiza a la memoria a largo plazo, este punto débil está bien identificado

Ver originalResponder0

BorrowingBuddy

· hace4h

La latencia de P95 se redujo en un 91 %, y la optimización de la cola larga es más difícil que la latencia promedio

Ver originalResponder0

GateUser-f78f1f3e

· hace4h

¿La recuperación de memoria en 0.71 segundos puede soportar alta concurrencia en un entorno de producción?

Ver originalResponder0

MintColdBrew

· hace4h

Las relaciones de entidades entre sesiones usando bases de datos gráficas, esta dirección de mejora es muy inteligente

Ver originalResponder0

NightFlightPaperCrane

· hace4h

La memoria incorporada de OpenAI realmente es inútil, finalmente alguien la ha hecho en serio

Ver originalResponder0

GateUser-4bd1cc87

· hace4h

¿A qué escenario de prueba específico se refiere la diferencia del 26% entre LOCOMO de referencia y OpenAI?

Ver originalResponder0

Temas de actualidad
Ver más
#
TradfiTradingChallenge
238.32K Popularidad
#
GrayscaleBuysAndStakesOver510KHYPE
8.92M Popularidad
#
IsraelStrikesIranBTCPlunges
48.54K Popularidad
#
#DailyPolymarketHotspot
1.02M Popularidad
#
SpaceXOfficiallyFilesforIPO
752.7K Popularidad

Fijado

Mem0 publica investigación sobre arquitectura de memoria de larga duración: precisión un 26% superior a OpenAI, retraso en inferencia reducido en un 91%

Temas de actualidad

TradfiTradingChallenge

GrayscaleBuysAndStakesOver510KHYPE

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

SpaceXOfficiallyFilesforIPO

Fijado