Google Research publica ReasoningBank, un marco de memoria para agentes inteligentes, que permite a los agentes impulsados por grandes modelos aprender continuamente después de su despliegue. Refinan el éxito y fracaso de tareas pasadas en "patrones de razonamiento" almacenados en una base de memoria, para consultar y actuar en tareas similares, transformando experiencias fallidas en reglas de evitación. La diferencia con Synapse y Agent Workflow Memory radica en los objetos, la estructura y la incorporación de trayectorias de fallos. La publicación también presenta MaTTS, que invierte más potencia de cálculo en la fase de razonamiento y memoriza el proceso de exploración. La expansión paralela y secuencial mejora la robustez. Los experimentos muestran que, en los benchmarks WebArena y SWE-Bench-Verified, ReasoningBank supera en un 8.3% y un 4.6% respectivamente a la línea base sin memoria, ahorrando en promedio unas 3 pasos; al combinar MaTTS y expansión paralela, WebArena aumenta en 3 puntos porcentuales, reduciendo en 0.4 pasos adicionales.

CoinNetwork

2026-04-22 08:48:22

Generación de resúmenes en curso

La noticia de CoinWorld, según la monitorización de Beating, el Instituto de Investigación de Google publicó el marco de memoria de agentes inteligentes ReasoningBank, que permite que los agentes impulsados por grandes modelos aprendan continuamente después de su despliegue. La estrategia principal consiste en extraer las experiencias de éxito y fracaso de tareas pasadas en estrategias de razonamiento universales almacenadas en una memoria, y la próxima vez que encuentren tareas similares, primero recuperan y luego ejecutan. El artículo relacionado fue publicado en ICLR, y el código ya está abierto en GitHub. Anteriormente, las dos principales soluciones tenían defectos: Synapse registra la trayectoria completa de acciones, pero con granularidad demasiado fina para transferir; Agent Workflow Memory solo extrae flujos de trabajo de casos exitosos. ReasoningBank modificó dos aspectos: en lugar de almacenar «secuencias de acciones», ahora almacena «patrones de razonamiento», y cada memoria incluye un título, una descripción y un contenido en estructura de tres campos; también incorpora las trayectorias fallidas en el aprendizaje. El modelo llama a otro gran modelo para autoevaluar la trayectoria de ejecución, y las experiencias fallidas se descomponen en reglas para evitar errores, por ejemplo, de «hacer clic en el botón Cargar más al verlo» a «verificar primero la identificación de la página actual para evitar caer en desplazamiento infinito, y luego hacer clic en cargar más». El artículo también propone Memory-aware Test-time Scaling (MaTTS), que invierte más potencia de cálculo durante la inferencia para intentar repetidamente, y almacena el proceso de exploración en la memoria. La expansión paralela permite que el agente ejecute múltiples trayectorias diferentes para la misma tarea, extrayendo estrategias más robustas mediante auto comparación; la expansión secuencial refina repetidamente una sola trayectoria, almacenando los razonamientos intermedios en la memoria. En los benchmarks WebArena para tareas en navegador y SWE-Bench-Verified para tareas de código, usando Gemini 2.5 Flash como agente ReAct, ReasoningBank supera en éxito a la línea base sin memoria en un 8.3% en WebArena y en un 4.6% en SWE-Bench-Verified, con una reducción de aproximadamente 3 pasos en cada tarea; tras aplicar la expansión paralela MaTTS (k=5), la tasa de éxito en WebArena aumenta otros 3 puntos porcentuales y el número de pasos se reduce en 0.4.

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

Recompensa
Me gusta
Comentar
Republicar
Compartir

Comentar

Añadir un comentario

Sin comentarios

Temas de actualidad
Ver más
#
Gate13thAnniversaryLive
935.46K Popularidad
#
WCTCTradingChallengeShare8MUSDT
774.78K Popularidad
#
BitcoinBouncesBack
195.95K Popularidad
#
IsraelStrikesIranBTCPlunges
30.62K Popularidad
#
USIranTalksProgress
694.03K Popularidad

Anclado

Google lanza ReasoningBank, donde los agentes extraen estrategias de razonamiento a partir de experiencias de éxito y fracaso.

Temas de actualidad

Gate13thAnniversaryLive

WCTCTradingChallengeShare8MUSDT

BitcoinBouncesBack

IsraelStrikesIranBTCPlunges

USIranTalksProgress

Anclado