AgentFlow قام بتجميع 300 وكيل واكتشف 10 ثغرات من نوع "يوم صفر" في متصفح كروم تتضمن هروب الحماية (sandbox escape).

ME News رسالة، 23 أبريل (UTC+8)، وفقًا لمراقبة Dongcha Beating، اقترح فريق UCSB Yu Feng بالتعاون مع fuzz.land وغيرها من المؤسسات AgentFlow، الذي يقوم بتوليد harness متعدد العوامل تلقائيًا (برنامج ينظم تقسيم أدوار العوامل، نقل المعلومات، تخصيص الأدوات ومنطق إعادة المحاولة) لاكتشاف الثغرات. تشير الورقة البحثية إلى أنه عند ثبات النموذج، فإن تغيير الـ harness وحده يمكن أن يجعل معدل النجاح يختلف عدة مرات، لكن الحلول الحالية غالبًا ما تكون مكتوبة يدويًا أو تبحث فقط في مساحة تصميم محلية. يستخدم AgentFlow لغة DSL رسومية مع أنواع لتوحيد الأبعاد الخمسة للـ harness (الأدوار، الطوبولوجيا، نمط الرسائل، ربط الأدوات، بروتوكول التنسيق) في برنامج رسومي قابل للتعديل، ويمكن في خطوة واحدة إضافة أو تعديل العوامل والطوبولوجيا والـ prompt ومجموعة الأدوات. تحدد الحلقة الخارجية خطوات الفشل من إشارات وقت التشغيل مثل تغطية البرنامج المستهدف وتقارير الـ sanitizer، بدلاً من التغذية الراجعة الثنائية نجاح/فشل. على TerminalBench-2 مع Claude Opus 4.6 حقق 84.3% (75/89)، وهي أعلى درجة من نوعها في هذا التصنيف. على قاعدة كود Chrome (35 مليون سطر من C/C++)، قام النظام بتجميع harness مكون من أكثر من 300 عامل، وتطورت تعليمات العوامل تلقائيًا لاستهداف ثغرات أمان الذاكرة في C++، مع طلب التحقق من الأعطال باستخدام ASAN/UBSAN، وتقوم عدة عوامل بإزالة التكرار عبر المستندات المشتركة وأقفال الملفات. باستخدام النموذج مفتوح المصدر Kimi K2.5 على 192 شريحة H100 لمدة 7 أيام، تم اكتشاف 10 ثغرات يوم صفر، تم تأكيدها جميعًا عبر Chrome VRP. 6 منها حصلت على أرقام CVE، وتتضمن WebCodecs وProxy وNetwork وCodecs وRendering، وتشمل أنواعها UAF وتجاوز عدد صحيح وتجاوز سعة المخزن المؤقت للكومة، ومنها CVE-2026-5280 وCVE-2026-6297 وهما من مستوى Critical للهروب من الصندوق الرملي. قال المؤسس المشارك لـ fuzz.land، Shou Chaofan، إن بعض الثغرات تم اكتشافها في البداية باستخدام MiniMax M2.5، كما يستطيع MiniMax M2.5 وOpus 4.6 اكتشاف معظمها. AgentFlow أصبح مفتوح المصدر. (المصدر: BlockBeats)
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت