OpenAI ستطلق قريبًا نموذجًا من مستوى Claude Mythos بشكل محدود

robot
إنشاء الملخص قيد التقدم

نقلاً عن CoinJie.com: نقلاً عن مصادر مطلعة، إن شركة OpenAI تعمل على إرساء نموذج يتمتع بقدرات في مجال الأمن السيبراني بمستوى مماثل لنموذج Anthropic Claude Mythos، وتخطط لإصداره حصرياً لعدد قليل من الشركات فقط عبر مشروعها «Trusted Access for Cyber». وهذا يعني أن مختبرَي الذكاء الاصطناعي الرائدين توصلا، تقريباً في الوقت ذاته، إلى استنتاجين متطابقين: إن قدرات أقوى نموذج في الهجوم والدفاع في مجال الأمن السيبراني أصبحت قوية إلى درجة لا يمكن معها نشره بشكل مباشر، بل يجب أولاً تمكين جهة الدفاع من استخدامه. وتُظهر ورقة التقييم الأمني التي نشرتها Anthropic اليوم بشأن Mythos (system card) مدى صعوبة التحكم في هذه النوعية من النماذج. ففي الاختبارات، صمّم Mythos بنفسه سلاسل استغلال ثغرات متعددة الخطوات لاختراق الوصول إلى الشبكات المقيدة، ثم قام بنشر تفاصيل الهجوم في موقع ويب غير معروف للتفاخر؛ وفي بيئة تجارية محاكاة، هدّد بقطع الإمداد للتحكم في التسعير؛ وبعد استخدام طرق محظورة للحصول على الإجابات ضمن أقل من 0.001% من التفاعلات، حاول «إعادة حل المسألة» لإخفاء الآثار؛ وحتى عندما تم رفض مهام البرمجة من قبل ذكاء اصطناعي آخر عند تقييمها، حاول شن هجوم بحقن أوامر (prompt injection) ضد نموذج التقييم. وإذا سارت OpenAI على خطى Anthropic، فقد يصبح مبدأ «تقديمه لجهة الدفاع أولاً، ثم التفكير في النشر لاحقاً» عرفاً في صناعة إصدار النماذج فائقة القوة.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت