AgentFlow قام بتجميع 300 وكيل لاكتشاف 10 ثغرات يوم صفر في Chrome مع تجاوز صندوق الحماية.

ME News رسالة، في 23 أبريل (UTC+8)، وفقًا لرصد Beating، اقترح فريق UCSB Yu Feng بالتعاون مع fuzz.land وغيرها من المؤسسات AgentFlow، وهو نظام يقوم تلقائيًا بتوليد harness متعدد الوكلاء (برامج تنظم توزيع أدوار الوكلاء، نقل المعلومات، توزيع الأدوات، ومنطق إعادة المحاولة) لاكتشاف الثغرات. تشير الورقة إلى أنه عندما لا يتغير النموذج، فقط تغيير الـ harness يمكن أن يختلف معدل النجاح بعدة أضعاف، لكن الحلول الحالية غالبًا ما تكون مكتوبة يدويًا أو تبحث فقط في مساحات التصميم المحلية. يستخدم AgentFlow DSL رسومية مكتوبة بأنواع لدمج الأبعاد الخمسة للـ harness (الأدوار، الطوبولوجيا، أنماط الرسائل، ربط الأدوات، بروتوكول التنسيق) في برنامج رسومي قابل للتحرير، ويمكنه في خطوة واحدة إضافة أو تعديل الوكلاء، الطوبولوجيا، الاستفسارات، ومجموعات الأدوات. الحلقة الخارجية تحدد الخطوات الفاشلة من إشارات وقت التشغيل مثل تغطية البرنامج المستهدف وتقارير sanitizer، بدلاً من التغذية الراجعة الثنائية (نجاح/فشل). على TerminalBench-2، مع Claude Opus 4.6، وصلت النتيجة إلى 84.3% (75/89)، وهي أعلى درجة في هذا التصنيف المماثل. على قاعدة كود Chrome (35 مليون سطر من C/C++)، قام النظام بتوليد harness مكون من أكثر من 300 وكيل، وقام بتطوير تعليمات الوكلاء تلقائيًا لاستهداف ثغرات أمان الذاكرة في C++، وتطلب التحقق من الأعطال باستخدام ASAN/UBSAN، مع إزالة التكرار عبر المستندات المشتركة وأقفال الملفات. باستخدام النموذج المفتوح المصدر Kimi K2.5 على 192 شريحة H100 لمدة 7 أيام، تم اكتشاف 10 ثغرات يوم الصفر، وتم تأكيدها جميعًا عبر Chrome VRP. تم تخصيص 6 منها أرقام CVE، تشمل WebCodecs وProxy وNetwork وCodecs وRendering، وتتضمن أنواعًا مثل UAF وتجاوز الأعداد الصحيحة وتجاوز سعة المخزن المؤقت في الكومة، ومن بينها CVE-2026-5280 وCVE-2026-6297 من مستوى Critical للهروب من الصندوق الرملي. قال Shou Chaofan، المؤسس المشارك لـ fuzz.land، إن بعض الثغرات تم اكتشافها في البداية باستخدام MiniMax M2.5، ويمكن لكل من MiniMax M2.5 وOpus 4.6 اكتشاف معظمها. AgentFlow مفتوح المصدر. (المصدر: BlockBeats)
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت