Google Research 发布 ReasoningBank 智能体记忆框架，使大模型驱动的智能体在部署后持续学习。将过往任务的成功与失败提炼为“推理模式”存入记忆库，遇到类似任务时先检索再执行，失败经验转化为规避规则。与 Synapse、Agent Workflow Memory 的差异在对象、结构与纳入失败轨迹。论文还提出 MaTTS，在推理阶段投入更多算力并将探索过程记忆化。并行扩展与顺序扩展提升稳健性。实验证明，在 WebArena 与 SWE-Bench-Verified 基准上，ReasoningBank 分别比无记忆基线提升 8.3% 与 4.6%，平均节省约 3 步；叠加 MaTTS 与并行扩展后，WebArena 再增 3 个百分点，步数再降 0.4 步。

CoinNetwork

2026-04-22 08:48:22

Генерация тезисов в процессе

Битсайт сообщает, что согласно мониторингу Beating, исследовательский институт Google выпустил рамочную структуру памяти для интеллектуальных агентов ReasoningBank, позволяющую моделям с большим числом параметров постоянно обучаться после развертывания. Основной подход заключается в том, чтобы обобщить опыт успешных и неудачных задач в универсальные стратегии рассуждения и сохранить их в памяти, чтобы при столкновении с похожими задачами сначала осуществлять поиск, а затем выполнять. Связанная статья опубликована на ICLR, код уже открыт на GitHub. Ранее существовали два основных подхода, каждый из которых имел недостатки: Synapse записывает полный маршрут действий, что слишком детально и трудно переносимо; Agent Workflow Memory извлекает рабочие процессы только из успешных случаев. ReasoningBank изменил два аспекта: объект хранения заменен с «последовательности действий» на «модель рассуждения», каждая запись содержит структурированные поля: заголовок, описание и содержание; также включены неудачные маршруты для обучения. Модель вызывает другую большую модель для самопроверки выполненного маршрута, а неудачный опыт разбит на правила избегания ошибок, например, вместо «видишь кнопку Load More — нажимай» — «сначала проверь текущий статус страницы, чтобы избежать бесконечной прокрутки, затем нажимай загрузить еще». В статье также предложена Memory-aware Test-time Scaling (MaTTS), при которой во время рассуждения выделяется больше вычислительных ресурсов для многократных попыток, а процесс исследования сохраняется в памяти. Параллельное расширение позволяет агенту запускать несколько различных маршрутов для одной задачи и извлекать более устойчивые стратегии через самосравнение; последовательное расширение внутри одного маршрута включает многократную доработку, а промежуточные рассуждения записываются в память. На двух бенчмарках — браузерной задаче WebArena и задаче с проверенными кодами SWE-Bench-Verified — при использовании ReAct-агента Gemini 2.5 Flash с ReasoningBank по сравнению с базовой моделью без памяти уровень успеха на WebArena вырос на 8,3%, на SWE-Bench-Verified — на 4,6%, при этом в среднем количество шагов сократилось примерно на 3. После добавления параллельного расширения MaTTS (k=5) уровень успеха на WebArena увеличился еще на 3 процентных пункта, а количество шагов снизилось еще на 0,4.

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .

Награда
лайк
комментарий
Репост
Поделиться

комментарий

Добавить комментарий

Нет комментариев

Популярные темы
Подробнее
#
Gate13thAnniversaryLive
1.03M Популярность
#
WCTCTradingChallengeShare8MUSDT
785.22K Популярность
#
BitcoinBouncesBack
202.44K Популярность
#
IsraelStrikesIranBTCPlunges
30.66K Популярность
#
USIranTalksProgress
787.45K Популярность

Закрепить

Карта сайта

Google выпустила ReasoningBank, интеллектуальные системы извлекают стратегии рассуждения из опыта успехов и неудач

Популярные темы

Gate13thAnniversaryLive

WCTCTradingChallengeShare8MUSDT

BitcoinBouncesBack

IsraelStrikesIranBTCPlunges

USIranTalksProgress

Закрепить