Mythos Preview pulls the industry back to defense: The fundamental security of DeFi is shaken, and AI resources are flooding into the risk control track

robot
إنشاء الملخص قيد التقدم

Mythos جعل صناعة الذكاء الاصطناعي تتجه نحو الدفاع: بروز بعض القضايا الرئيسية

تغريدة ديودي داس لم تثير النقاش فقط، بل أعادت القطاع من “مدى قوة النموذج” إلى “ما الذي يمكن أن يفعله النموذج القوي، وكيف ينبغي إدارته”. وفقًا للمعلومات المتاحة، حصلت Mythos Preview على 99/100 في BenchLM، وتقييم كامل لمهام الوكيل، وبلغت دقة معيار البرمجة SWE-bench حوالي 94%، وهو أعلى بشكل واضح من Claude Opus 4.6. ووفقًا للتقارير، أن هذا النموذج يمكن تحديد موقع ثغرة في OpenBSD قبل 27 عامًا باستخدام أقل من 50 دولارًا من القدرة الحاسوبية، ويمكنه أيضًا ربط سلاسل ثغرات نواة لينكس بنفسه. لم يصدر كارباتي وليكونون بعد أي تصريحات علنية، ربما لأن النموذج لم يُتاح بعد للمحققين المستقلين.

حكمتي: التركيز في الصناعة يتحول من “القدرة على الترتيب” إلى “الدفاع والسيطرة”. تحاول شركة أنثروبيك عبر مشروع Glasswing التعامل مع قضايا الاستخدام المزدوج قبل أي شيء.

  • إدخال الشركات يخلق فجوة في الموارد والمعلومات: لقد أدخلت Glasswing أكثر من 40 شريكًا (Apple، Microsoft كلاهما موجودان)، مع تخصيص مليار دولار لسيناريوهات الأمان؛ من الصعب على المشاريع مفتوحة المصدر الحصول على موارد مماثلة.
  • تبدأ فرضية أمان DeFi في التهتز: العقود الذكية على السلسلة تحتوي على حوالي 200 مليار دولار. بعد خسارة Drift 285 مليون دولار على Solana، تم إطلاق خطة أمان STRIDE. أدوات اكتشاف ثغرات الذكاء الاصطناعي تتطور بشكل متزايد، والأنظمة التي لم تُجرِ التحقق الرسمي ستُقيم من قبل المودعين بمخاطر أكثر حدة.
  • التمويل يتجه نحو “الذكاء الاصطناعي المسؤول”: بعد جولة التمويل G، يُقدر تقييم أنثروبيك بحوالي 380 مليار دولار، مما يدل على تفضيل المستثمرين للأمان. هل يمكن لـ RSP 3.0 أن يمنع سوء الاستخدام حقًا، هذا ما سنراقبه.

الدرجات ليست كل شيء: ما إذا كانت ستُطلق أم لا يعتمد على عتبة الأمان والسيطرة

شراء الشركات يركز على “هل يمكن الإطلاق بأمان”، وليس على ترتيب القوائم. بعد التسريب، تراجعت أسهم الأمن بنسبة 5-10%، ومع عدم وجود معارضة علنية من المنافسين، يُظهر ذلك أن السوق يولي أهمية أكبر لـ"الدفاع/التحكم" بدلاً من “القدرة”.

المنظور الأساس التغيير التقييم
التركيز على القدرة BenchLM 99/100، المركز الأول في مهام الوكيل، عرض اختبار داخلي لثغرة فايرفوكس توقعات المطورين بشأن برمجة الذكاء الاصطناعي/سير عمل الوكيل ترتفع قد يكون مبالغًا فيه؛ موثوقية البيئة الإنتاجية ودرجات الاختبار أمران مختلفان
الأولوية للأمان تحالف Glasswing، اكتشاف الثغرات اليومية (مثل ثغرة FFmpeg قبل 16 سنة) التركيز على نقاط ضعف البنية التحتية، وتقدم تدقيق الأمان بمساعدة الذكاء الاصطناعي يُقلل من التقدير؛ تزداد مصداقية أنثروبيك كشريك أمني، ويصعب على المنافسين اللحاق بها
الحذر السوقي تراجع أسهم الأمان، خسارة 285 مليون دولار على Solana يعيد المستثمرون تقييم مخاطر الانتشار خلال 6-18 شهرًا معقول على المدى القصير؛ قد تحقق تقنيات الدفاع طويلة الأمد عوائد مفرطة
عتبة الأمان تقييم RSP لم يصل بعد إلى عتبة الاستقلالية، لكن النموذج لم يُختبر بعد تفضيل الصناعة للأنظمة المدققة والمُصدرة بشكل خاضع للرقابة إطار فعال؛ غير ودود للباحثين، لكن المشترين الملتزمين يفضلونه

الاجماع يتجه نحو التوافق: بدلاً من سؤال “ماذا يمكن أن يفعل الذكاء الاصطناعي بعد ذلك”، من الأفضل أن نسأل “كيف نجعله يعمل ضمن الحدود”.

معلومات مهمة

  • Mythos قوي في الأداء لكنه يقتصر على التجربة للشركات: معايير عالية مع عينات ثغرات حقيقية، بالإضافة إلى دخول مبكر على مستوى الشركات، يشكل مزيج “قدرة عالية + وصول مقيد”.
  • إعادة تقييم مخاطر DeFi: مع ارتفاع قيمة العقود، مع تسريع الهجمات والدفاعات، ستتحول التحقق الرسمي والتدقيق الأمني بواسطة الذكاء الاصطناعي من عناصر إضافية إلى معايير دخول.
  • التمويل والسرد يتفاعلان: رأس المال، والموارد البشرية تتجمع حول “نموذج قوي يمكن السيطرة عليه”، وبيئة مفتوحة وبحوث مستقلة تصبح أكثر هامشية.
  • منطق قرار الإطلاق يتغير: عتبة الأمان، القدرة على العزل، والقدرة على التدقيق تحل محل “درجات الترتيب” كمحرك رئيسي لشراء الشركات.

الأهمية: عالية
التصنيف: إصدار النماذج|أمان الذكاء الاصطناعي|تأثير السوق

الاستنتاج: الشركات والتمويل يدفعون بالفعل نحو وضعية دفاعية لأنثروبيك؛ والمطورون الذين لا يركزون على الأمان، والباحثون بدون قنوات شركات، يواجهون مخاطر هامشية متزايدة.

الحكم: من منظور السرد، لا زلنا في مرحلة “مبكرة ولكن تتسارع”؛ المستفيدون الأكبر هم المطورون والمؤسسات ذات القدرات الأمنية والامتثال. على المتداولين الثانويين مراقبة تطورات الأمان والدخول، فبالنسبة للمشاركين الذين يملكون فقط تعرضًا لبيئة مفتوحة، هذا الوضع غير ملائم.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت