أعلنت تقييمات AISI البريطانية أن معاينة Claude Mythos حققت معدل نجاح بنسبة 73٪ في مهام الدفاع والهجوم على الشبكة على مستوى الخبراء، وحققت لأول مرة إكمال كامل لمحاكاة الهجوم والدفاع في The Last Ones بـ32 خطوة، مع متوسط إتمام حوالي 22 خطوة؛ وOpus4.6 بمتوسط 16 خطوة. أجريت الاختبارات في بيئة خاضعة للسيطرة، وتفتقر إلى الدفاعات النشطة وأدوات الدفاع، لذلك لا يمكن اعتبارها مماثلة لاختراق أنظمة حقيقية. وأكدت AISI أنها ستواصل التقييم في بيئة محاكاة تتضمن دفاعات نشطة لتحسين طرق تقييم الأمان.

MeNews

2026-04-29 11:06:33

إنشاء الملخص قيد التقدم

أخبار ME News، 14 أبريل (بتوقيت UTC+8)، وفقًا لمراقبة 1M AI News، أصدرت معهد أبحاث أمان الذكاء الاصطناعي في المملكة المتحدة (AISI) تقييم قدرة أمان الشبكة لنموذج Claude Mythos Preview. في مهمة CTF على مستوى الخبراء (صعوبة لا يمكن لأي نموذج إكمالها قبل أبريل 2025)، حقق Mythos Preview معدل نجاح بنسبة 73%. كما أنشأ AISI سيناريو محاكاة هجوم شبكي مؤسسي من 32 خطوة بعنوان “The Last Ones” (TLO)، يغطي كامل العملية من الاستطلاع الأولي إلى السيطرة الكاملة على الشبكة، ويستغرق الإنسان حوالي 20 ساعة لإكماله. Mythos Preview هو النموذج الأول الذي أكمل جميع المراحل، حيث أكمل 3 مرات من أصل 10 اختبارات بشكل كامل، ومتوسط جميع المحاولات هو إكمال 22 خطوة. جاء Claude Opus 4.6 في المركز الثاني، بمعدل إكمال 16 خطوة في المتوسط. أوضح AISI أن النتائج المذكورة أعلاه تم تحقيقها في ظروف مراقبة مع توجيه واضح وتوفير صلاحية الوصول إلى الشبكة. هناك فروق مهمة بين بيئة الاختبار والشبكة الحقيقية للمؤسسة: لا يوجد دفاع نشط، ولا أدوات دفاع، ولا يتم معاقبة تنشيط إنذارات الأمان. لذلك، لا يمكن التأكد مما إذا كان Mythos Preview قادرًا على اختراق أنظمة محمية بشكل صارم. قبل عامين، كانت أفضل نماذج الذكاء الاصطناعي تكاد لا تستطيع إكمال المهام الشبكية الأساسية. وأشار AISI إلى أن سرعة هذا التقدم تتطلب ترقية طرق تقييم الأمان، وسيتم الاستمرار في الاختبار في بيئات تحاكي وجود دفاع نشط واستجابة فورية في المستقبل. (المصدر: BlockBeats)

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

أعجبني
إعجاب
تعليق
إعادة النشر
مشاركة

تعليق

إضافة تعليق

لا توجد تعليقات

المواضيع الرائجة
عرض المزيد
#
WCTCTradingKingPK
363.51K درجة الشعبية
#
CryptoMarketsDipSlightly
268.07K درجة الشعبية
#
IsraelStrikesIranBTCPlunges
35.94K درجة الشعبية
#
#DailyPolymarketHotspot
699.2K درجة الشعبية
#
StrategyAccumulates2xMiningRate
139.47M درجة الشعبية

تثبيت

خريطة الموقع

معهد أبحاث أمان الذكاء الاصطناعي في المملكة المتحدة: معاينة كلود ميثوس تصبح أول ذكاء اصطناعي يهاجم شبكة مؤسساتية مكونة من 32 خطوة بشكل مستقل

المواضيع الرائجة

WCTCTradingKingPK

CryptoMarketsDipSlightly

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

StrategyAccumulates2xMiningRate

تثبيت