تظهر مراقبة Beating أن AgentFlow يقوم تلقائيًا بدمج العديد من وكلاء الحصان باستخدام مخطط DSL نوعي يوحد عناصر الأبعاد الخمسة (الدور، الطوبولوجيا، نمط الرسائل، ربط الأدوات، بروتوكول التنسيق) في برنامج مخطط قابل للتحرير، مع تحديد فشل الإشارة عند الحلقة الخارجية باستخدام إشارة وقت التشغيل. في مشروع Chrome، تم استكشاف حوالي 210 وكلاء، و18 دورًا، و192 عملية متوازية، وخلال 7 أيام تم اكتشاف 10 ثغرات يوم صفر، و6 ثغرات CVE (بما في ذلك الهروب من الصندوق الرمل)، وقد تم إصدار AgentFlow كمصدر مفتوح.

BlockBeatNews

2026-04-23 06:51:01

إنشاء الملخص قيد التقدم

وفقًا لمراقبة Beating، اقترحت فريق فنج يو من UCSB بالتعاون مع مؤسسات مثل fuzz.land أداة AgentFlow، التي تقوم بالتوليف التلقائي لنظام استدعاء الوكيل المتعدد (البرامج التي تنسق تقسيم الأدوار، نقل المعلومات، توزيع الأدوات، ومنطق إعادة المحاولة) لاكتشاف الثغرات. وأشارت الورقة إلى أنه عند ثبات النموذج، يمكن فقط بتغيير نظام الاستدعاء أن يزيد معدل النجاح بعدة أضعاف، لكن الحلول الحالية غالبًا ما تكون مكتوبة يدويًا أو تبحث فقط في مساحة تصميم محلية.

يستخدم AgentFlow لغة مخطط رسومي نوعي (DSL) لتوحيد خمسة أبعاد لنظام الاستدعاء (الأدوار، الهيكلية، نمط الرسائل، ربط الأدوات، بروتوكول التنسيق) في برنامج رسومي قابل للتحرير، حيث يمكن خطوة بخطوة إضافة أو تعديل الوكيل، الهيكلية، المطالبات، ومجموعة الأدوات. يدور الحلقة الخارجية حول تحديد نقاط الفشل من خلال إشارات وقت التشغيل مثل تغطية البرنامج المستهدف وتقارير المعقم، بدلاً من الاعتماد على ردود الفعل الثنائية النجاح/الفشل. على منصة TerminalBench-2، مع استخدام Claude Opus 4.6، حققت نسبة نجاح بلغت 84.3% (75 من 89)، وهو أعلى معدل في فئتها على هذا التصنيف.

على مستودع كود Chrome (الذي يحتوي على 35 مليون سطر من C/C++)، قام النظام بتوليف نظام استدعاء يضم 18 نوعًا من الأدوار، حوالي 210 وكيل، ويشمل 7 محللات فرعية، و192 مستكشفًا متوازيًا، وخط أنابيب تصنيف الأعطال المكون من أربع مراحل، حيث يتم إزالة التكرار بواسطة وكلاء متخصصين مثل Crash Filter وRoot Cause Analyzer باستخدام توقيع فشل ASAN فريد. تم تشغيل النموذج المفتوح المصدر Kimi K2.5 على 192 وحدة H100 لمدة 7 أيام، ونجح في اكتشاف 10 ثغرات يوم صفر، جميعها تم تأكيدها من قبل برنامج Chrome VRP. منها 6 تم منحها أرقام CVE، وتشمل ثغرات في WebCodecs، وProxy، وNetwork، وCodecs، وRendering، وتتضمن أنواعًا مثل UAF، وتجاوز الأعداد الصحيحة، وتجاوز مخزن مؤقت للذاكرة على الكومة، مع CVE-2026-5280 وCVE-2026-6297 كدرجات حرجة من نوع هروب من الصندوق الرملي.

قال مؤسس مشارك في fuzz.land، شو تشوان فان، إن بعض الثغرات اكتشفت في البداية باستخدام MiniMax M2.5، وأن MiniMax M2.5 و Opus 4.6 يمكنهما أيضًا اكتشاف معظمها. وقد تم إصدار AgentFlow كمصدر مفتوح.

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

أعجبني
إعجاب
تعليق
إعادة النشر
مشاركة

تعليق

إضافة تعليق

لا توجد تعليقات

المواضيع الرائجة
عرض المزيد
#
Gate13thAnniversaryLive
1.22M درجة الشعبية
#
WCTCTradingChallengeShare8MUSDT
797.9K درجة الشعبية
#
BitcoinBouncesBack
213.71K درجة الشعبية
#
IsraelStrikesIranBTCPlunges
30.66K درجة الشعبية
#
EthereumMemeSeasonReturns
2M درجة الشعبية

تثبيت

خريطة الموقع

AgentFlow يدمج تلقائيًا نظام وكلاء متعدد للكشف عن ثغرة يوم الصفر في هروب صندوق الرمل Chrome

المواضيع الرائجة

Gate13thAnniversaryLive

WCTCTradingChallengeShare8MUSDT

BitcoinBouncesBack

IsraelStrikesIranBTCPlunges

EthereumMemeSeasonReturns

تثبيت