وكيل تدفق يجمع 300 وكيل ليكتشف 10 ثغرات يوم الصفر في كروم تتضمن هروب الحماية

ME News أخبار، في 23 أبريل (UTC+8)، وفقًا لرصد Beating، اقترح فريق UCSB Yu Feng بالتعاون مع fuzz.land وغيرها من المؤسسات AgentFlow، وهو أداة لتوليد harness متعدد الوكلاء تلقائيًا (برنامج ينظم تقسيم أدوار الوكلاء، نقل المعلومات، توزيع الأدوات، ومنطق إعادة المحاولة) لاكتشاف الثغرات.
تشير الورقة إلى أنه عندما يكون النموذج ثابتًا، فإن تغيير harness فقط يمكن أن يجعل فرق معدل النجاح عدة أضعاف، لكن الحلول الحالية غالبًا ما تكون مكتوبة يدويًا أو تبحث فقط في مساحة التصميم المحلية.
يستخدم AgentFlow DSL بياني بنوع لتحويل الأبعاد الخمسة لـ harness (الأدوار، الطوبولوجيا، نمط الرسائل، ربط الأدوات، بروتوكول التنسيق) إلى برنامج بياني قابل للتحرير، ويمكنه في خطوة واحدة إضافة أو تعديل وكلاء، طوبولوجيا، برومبتات، ومجموعات أدوات.
تقوم الحلقة الخارجية بتحديد مراحل الفشل من إشارات وقت التشغيل مثل تغطية البرنامج المستهدف وتقارير sanitizer، لتحل محل التغذية الراجعة الثنائية (نجاح/فشل).
على TerminalBench-2 مع Claude Opus 4.6، حقق 84.3% (75/89)، وهو أعلى درجة في فئته على هذا التصنيف.
على قاعدة كود Chrome (35 مليون سطر من C/C++)، قام النظام بتوليد harness يتكون من أكثر من 300 وكيل، مع تعليمات وكلاء متطورة تلقائيًا تستهدف ثغرات أمان الذاكرة في C++، وتتطلب التحقق من الأعطال باستخدام ASAN/UBSAN، مع إزالة التكرار عبر المستندات المشتركة وأقفال الملفات بين الوكلاء المتعددين.
باستخدام النموذج مفتوح المصدر Kimi K2.5 على 192 شريحة H100 لمدة 7 أيام، تم اكتشاف 10 ثغرات يوم صفر، وتم تأكيدها جميعًا عبر Chrome VRP. تم منح 6 منها أرقام CVE، وتتعلق بـ WebCodecs، Proxy، Network، Codecs، Rendering، وأنواعها تشمل UAF، تجاوز عدد صحيح، وتجاوز سعة المخزن المؤقت للكومة، منها CVE-2026-5280 و CVE-2026-6297 هما من مستوى Critical لهروب من الحماية.
قال شو تشاوفان، المؤسس المشارك لـ fuzz.land، إن بعض الثغرات تم اكتشافها في البداية باستخدام MiniMax M2.5، وأن MiniMax M2.5 و Opus 4.6 يمكنهما أيضًا اكتشاف معظمها. تم فتح مصدر AgentFlow.
(المصدر: BlockBeats)
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت