AgentFlow يدمج تلقائيًا نظام وكلاء متعدد للكشف عن ثغرة يوم الصفر في هروب صندوق الرمل Chrome

robot
إنشاء الملخص قيد التقدم

وفقًا لمراقبة Beating، اقترحت فريق فنج يو من UCSB بالتعاون مع مؤسسات مثل fuzz.land أداة AgentFlow، التي تقوم بالتوليف التلقائي لنظام استدعاء الوكيل المتعدد (البرامج التي تنسق تقسيم الأدوار، نقل المعلومات، توزيع الأدوات، ومنطق إعادة المحاولة) لاكتشاف الثغرات. وأشارت الورقة إلى أنه عند ثبات النموذج، يمكن فقط بتغيير نظام الاستدعاء أن يزيد معدل النجاح بعدة أضعاف، لكن الحلول الحالية غالبًا ما تكون مكتوبة يدويًا أو تبحث فقط في مساحة تصميم محلية.

يستخدم AgentFlow لغة مخطط رسومي نوعي (DSL) لتوحيد خمسة أبعاد لنظام الاستدعاء (الأدوار، الهيكلية، نمط الرسائل، ربط الأدوات، بروتوكول التنسيق) في برنامج رسومي قابل للتحرير، حيث يمكن خطوة بخطوة إضافة أو تعديل الوكيل، الهيكلية، المطالبات، ومجموعة الأدوات. يدور الحلقة الخارجية حول تحديد نقاط الفشل من خلال إشارات وقت التشغيل مثل تغطية البرنامج المستهدف وتقارير المعقم، بدلاً من الاعتماد على ردود الفعل الثنائية النجاح/الفشل. على منصة TerminalBench-2، مع استخدام Claude Opus 4.6، حققت نسبة نجاح بلغت 84.3% (75 من 89)، وهو أعلى معدل في فئتها على هذا التصنيف.

على مستودع كود Chrome (الذي يحتوي على 35 مليون سطر من C/C++)، قام النظام بتوليف نظام استدعاء يضم 18 نوعًا من الأدوار، حوالي 210 وكيل، ويشمل 7 محللات فرعية، و192 مستكشفًا متوازيًا، وخط أنابيب تصنيف الأعطال المكون من أربع مراحل، حيث يتم إزالة التكرار بواسطة وكلاء متخصصين مثل Crash Filter وRoot Cause Analyzer باستخدام توقيع فشل ASAN فريد. تم تشغيل النموذج المفتوح المصدر Kimi K2.5 على 192 وحدة H100 لمدة 7 أيام، ونجح في اكتشاف 10 ثغرات يوم صفر، جميعها تم تأكيدها من قبل برنامج Chrome VRP. منها 6 تم منحها أرقام CVE، وتشمل ثغرات في WebCodecs، وProxy، وNetwork، وCodecs، وRendering، وتتضمن أنواعًا مثل UAF، وتجاوز الأعداد الصحيحة، وتجاوز مخزن مؤقت للذاكرة على الكومة، مع CVE-2026-5280 وCVE-2026-6297 كدرجات حرجة من نوع هروب من الصندوق الرملي.

قال مؤسس مشارك في fuzz.land، شو تشوان فان، إن بعض الثغرات اكتشفت في البداية باستخدام MiniMax M2.5، وأن MiniMax M2.5 و Opus 4.6 يمكنهما أيضًا اكتشاف معظمها. وقد تم إصدار AgentFlow كمصدر مفتوح.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت