أخبار ME News، 14 أبريل (بتوقيت UTC+8)، وفقًا لمراقبة 1M AI News، أصدرت المعهد البريطاني لأبحاث أمان الذكاء الاصطناعي (AISI) تقييم قدرات أمان الشبكات لنموذج Claude Mythos Preview. في مهمة CTF على مستوى الخبراء (صعوبة لا يمكن لأي نموذج إكمالها قبل أبريل 2025)، حقق Mythos Preview معدل نجاح بنسبة 73%. كما أنشأ AISI سيناريو محاكاة هجوم شبكي مؤسسي من 32 خطوة بعنوان “The Last Ones” (TLO)، يغطي كامل العملية من الاستطلاع الأولي إلى السيطرة الكاملة على الشبكة، ويستغرق الإنسان حوالي 20 ساعة لإكماله. Mythos Preview هو النموذج الأول الذي ينجح في إتمام جميع المراحل، حيث أكمل 3 من أصل 10 اختبارات بشكل كامل، ومتوسط جميع المحاولات هو إكمال 22 خطوة. يأتي Claude Opus 4.6 في المرتبة الثانية، بمتوسط إكمال 16 خطوة. أوضح AISI أن النتائج المذكورة أعلاه تم تحقيقها في ظروف مراقبة مع توجيه واضح وتوفير صلاحيات الوصول إلى الشبكة. هناك فروق مهمة بين بيئة الاختبار والشبكة الحقيقية للمؤسسة: لا يوجد دفاع نشط، ولا أدوات دفاع، ولا يتم معاقبة تفعيل إنذارات الأمان. لذلك، لا يمكن التأكد مما إذا كان Mythos Preview قادرًا على اختراق أنظمة محمية بشكل صارم. قبل عامين، كانت أفضل نماذج الذكاء الاصطناعي تكاد لا تستطيع إكمال المهام الشبكية الأساسية. وأشار AISI إلى أن سرعة هذا التقدم تتطلب ترقية طرق تقييم الأمان، وسيتم الاستمرار في الاختبار في بيئات تحاكي وجود دفاع نشط واستجابة فورية في المستقبل. (المصدر: BlockBeats)

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

أعجبني
إعجاب
تعليق
إعادة النشر
مشاركة

تعليق

إضافة تعليق

لا توجد تعليقات

المواضيع الرائجة
عرض المزيد
#
WCTCTradingKingPK
362.77K درجة الشعبية
#
CryptoMarketsDipSlightly
267.54K درجة الشعبية
#
IsraelStrikesIranBTCPlunges
35.94K درجة الشعبية
#
#DailyPolymarketHotspot
698.82K درجة الشعبية
#
StrategyAccumulates2xMiningRate
139.47M درجة الشعبية

تثبيت

خريطة الموقع

معهد الأمن السيبراني في المملكة المتحدة: معاينة كلاود ميثوس تصبح أول ذكاء اصطناعي يختبر بشكل مستقل هجومًا على شبكة مؤسسية يتخطى 32 خطوة

المواضيع الرائجة

WCTCTradingKingPK

CryptoMarketsDipSlightly

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

StrategyAccumulates2xMiningRate

تثبيت