AgentFlow يُولِّد تلقائيًا نظام وكلاء متعدد لاكتشاف ثغرات يوم الصفر في هروب صندوق حماية Chrome

وفقًا للمراقبة التي أجرتها Dongcha Beating، فريق UCSB بقيادة Feng Yu، بالتعاون مع fuzz.land ومنظمات أخرى، اقترحوا AgentFlow، وهو توليف تلقائي لنظام أدوات متعددة الوكلاء (برامج تنسق أدوار الوكيل، ونقل المعلومات، وتخصيص الأدوات، ومنطق إعادة المحاولة) لاكتشاف الثغرات. تشير الورقة إلى أنه عندما يظل النموذج دون تغيير، فإن مجرد تغيير نظام الأدوات يمكن أن يحسن معدلات النجاح بشكل كبير، ومع ذلك فإن الحلول الحالية غالبًا ما تكون مكتوبة يدويًا أو تبحث فقط في مساحات التصميم المحلية. يستخدم AgentFlow لغة رسومية من نوع DSL لربط خمسة أبعاد لنظام الأدوات (الأدوار، والطبقات، وأنماط الرسائل، وربط الأدوات، وبروتوكولات التنسيق) في برنامج رسومي قابل للتحرير، مما يسمح بتعديلات متزامنة على الوكلاء، والطبقات، والمحفزات، ومجموعات الأدوات في خطوة واحدة. الحلقة الخارجية تحدد نقاط الفشل من إشارات وقت التشغيل مثل تغطية البرنامج المستهدف وتقارير أدوات التحقق، وتستبدل التغذية الراجعة الثنائية للنجاح/الفشل. على TerminalBench-2، وبالاقتران مع Claude Opus 4.6، حقق معدل نجاح بنسبة 84.3% (75/89)، وهو أعلى مستوى في فئته على تلك القائمة. في قاعدة شفرة Chrome (35 مليون سطر من C/C++)، قام النظام بتوليف نظام أدوات يحتوي على 18 دورًا وما يقرب من 210 وكلاء، بما في ذلك 7 محللات للأنظمة الفرعية، و192 مستكشفًا متوازيًا، وأنبوب تصنيف الأعطال ذو أربع مراحل، حيث يقوم وكلاء مخصصون مثل Crash Filter و Root Cause Analyzer بإزالة التكرار باستخدام توقيعات الأعطال الفريدة لنظام ASAN. عند تشغيل النموذج مفتوح المصدر Kimi K2.5 على 192 وحدة H100 لمدة 7 أيام، اكتشف 10 ثغرات يوم صفر، تم تأكيدها جميعًا بواسطة VRP الخاص بـ Chrome. تم تعيين أرقام CVE لستة منها، وتشمل WebCodecs، وProxy، وNetwork، وCodecs، وRendering، مع أنواع تشمل UAF، وتجاوز الأعداد الصحيحة، وتجاوز سعة مخزن الذاكرة heap، ومن بين ذلك CVE-2026-5280 و CVE-2026-6297، وهما من الثغرات الحرجة التي تسمح بالهروب من الحماية في الصندوق الرملي. قال مؤسس fuzz.land المشارك Shou Chaofan إن بعض الثغرات تم اكتشافها في البداية باستخدام MiniMax M2.5، والذي، إلى جانب Opus 4.6، يمكنه أيضًا اكتشاف معظم الثغرات. تم إصدار AgentFlow كمصدر مفتوح.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت