معهد أبحاث أمان الذكاء الاصطناعي في المملكة المتحدة: معاينة كلود ميثوس تصبح أول ذكاء اصطناعي يهاجم شبكة مؤسساتية مكونة من 32 خطوة بشكل مستقل

robot
إنشاء الملخص قيد التقدم

أخبار ME News، 14 أبريل (بتوقيت UTC+8)، وفقًا لمراقبة 1M AI News، أصدرت معهد أبحاث أمان الذكاء الاصطناعي في المملكة المتحدة (AISI) تقييم قدرة أمان الشبكة لنموذج Claude Mythos Preview. في مهمة CTF على مستوى الخبراء (صعوبة لا يمكن لأي نموذج إكمالها قبل أبريل 2025)، حقق Mythos Preview معدل نجاح بنسبة 73%. كما أنشأ AISI سيناريو محاكاة هجوم شبكي مؤسسي من 32 خطوة بعنوان “The Last Ones” (TLO)، يغطي كامل العملية من الاستطلاع الأولي إلى السيطرة الكاملة على الشبكة، ويستغرق الإنسان حوالي 20 ساعة لإكماله. Mythos Preview هو النموذج الأول الذي أكمل جميع المراحل، حيث أكمل 3 مرات من أصل 10 اختبارات بشكل كامل، ومتوسط جميع المحاولات هو إكمال 22 خطوة. جاء Claude Opus 4.6 في المركز الثاني، بمعدل إكمال 16 خطوة في المتوسط. أوضح AISI أن النتائج المذكورة أعلاه تم تحقيقها في ظروف مراقبة مع توجيه واضح وتوفير صلاحية الوصول إلى الشبكة. هناك فروق مهمة بين بيئة الاختبار والشبكة الحقيقية للمؤسسة: لا يوجد دفاع نشط، ولا أدوات دفاع، ولا يتم معاقبة تنشيط إنذارات الأمان. لذلك، لا يمكن التأكد مما إذا كان Mythos Preview قادرًا على اختراق أنظمة محمية بشكل صارم. قبل عامين، كانت أفضل نماذج الذكاء الاصطناعي تكاد لا تستطيع إكمال المهام الشبكية الأساسية. وأشار AISI إلى أن سرعة هذا التقدم تتطلب ترقية طرق تقييم الأمان، وسيتم الاستمرار في الاختبار في بيئات تحاكي وجود دفاع نشط واستجابة فورية في المستقبل. (المصدر: BlockBeats)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت