أطلقت جوجل ReasoningBank، حيث يستخلص الوكيل الذكي استراتيجيات الاستنتاج من تجارب النجاح والفشل

robot
إنشاء الملخص قيد التقدم
أخبار ME، في 22 أبريل (بتوقيت UTC+8)، وفقًا لمراقبة 动察 Beating، أصدرت معهد أبحاث جوجل إطار عمل الذاكرة للذكاء الاصطناعي ReasoningBank، الذي يسمح للذكاء الاصطناعي المدعوم بالنماذج الكبيرة بالتعلم المستمر بعد النشر. النهج الأساسي هو تلخيص تجارب النجاح والفشل في المهام السابقة إلى استراتيجيات استنتاج عامة تُخزن في قاعدة الذاكرة، بحيث يتم استرجاعها قبل تنفيذ مهمة مماثلة في المرات القادمة. نُشرت الورقة ذات الصلة في مؤتمر ICLR، والكود متاح كمصدر مفتوح على GitHub.
كانت هناك عيوب في اثنين من الحلول الرئيسية السابقة: سجل Synapse مسار كامل للأفعال، لكن الدقة كانت عالية جدًا مما يصعب نقله؛ بينما يستخلص Agent Workflow Memory فقط سير العمل من الحالات الناجحة.
قام ReasoningBank بتعديل نقطتين: استبدال هدف التخزين من «تسلسل الأفعال» إلى «نمط الاستنتاج»، بحيث تحتوي كل ذاكرة على ثلاثة حقول منظمة: عنوان، وصف، ومحتوى؛ كما أُدرجت أيضًا مسارات الفشل في عملية التعلم.
يقوم النموذج باستدعاء نموذج كبير آخر لتقييم مسار التنفيذ، حيث يتم تفكيك تجارب الفشل إلى قواعد لتجنب الأخطاء، مثل ترقية قاعدة «عند رؤية زر Load More اضغط عليه» إلى «أولاً تحقق من علامة الصفحة الحالية، لتجنب الوقوع في التمرير اللانهائي، ثم اضغط على تحميل المزيد».
كما اقترحت الورقة تقنية أخرى تسمى Memory-aware Test-time Scaling (MaTTS)، حيث يتم تخصيص المزيد من القدرة الحاسوبية أثناء الاستنتاج لمحاولة متكررة، ويتم تخزين عملية الاستكشاف في الذاكرة.
التوسعة المتوازية تتيح للذكاء الاصطناعي تشغيل مسارات مختلفة لنفس المهمة، من خلال المقارنة الذاتية لاستنتاج استراتيجيات أكثر استقرارًا؛ بينما التوسعة التتابعية تتضمن تحسين متكرر لمسار واحد، مع تسجيل الاستنتاجات الوسيطة في الذاكرة.
على مقياسين، WebArena لمهام المتصفح وSWE-Bench-Verified لمهام الكود، تم استخدام نموذج Gemini 2.5 Flash كنظام ReAct، ووجد أن ReasoningBank يتفوق على خط الأساس بدون ذاكرة بنسبة نجاح أعلى بمقدار 8.3% على WebArena و4.6% على SWE-Bench-Verified، مع تقليل متوسط عدد الخطوات بمقدار حوالي 3 خطوات لكل مهمة؛
بعد تطبيق التوسعة المتوازية MaTTS (k=5)، زادت نسبة النجاح على WebArena بمقدار 3 نقاط مئوية، وانخفض عدد الخطوات بمقدار 0.4 خطوة أخرى.
(المصدر: BlockBeats)
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت