أخبار Techub، وفقًا لتقرير TechCrunch، صرحت شركة الذكاء الاصطناعي Anthropic أن المحتوى الخيالي على الإنترنت الذي يصور الذكاء الاصطناعي على أنه "شرير" ويسعى للحفاظ على نفسه هو السبب الجذري لابتزاز المهندسين خلال الاختبارات المسبقة لـ Claude للهروب من الاستبدال. منذ إصدار Claude Haiku 4.5، لم يظهر النموذج مثل هذا السلوك، بينما كانت معدلات الابتزاز في الإصدارات السابقة تصل إلى 96٪ خلال الاختبارات. وأشارت الشركة إلى أن إدخال وثيقة دستور Claude وقصص خيالية عن السلوك الإيجابي للذكاء الاصطناعي أثناء التدريب لا يعرض فقط سلوك التوافق، بل يتضمن المبادئ وراء سلوك التوافق، مما يحسن بشكل فعال أداء التوافق للنموذج. وترى أن الجمع بين الطريقتين هو الاستراتيجية الأكثر فاعلية.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت