وفقًا لمراقبة Beating، أعلنت شركة Anthropic عن تعديل استراتيجيتها الأمنية لتطوير نموذجها الجديد Claude Fable 5، وإلغاء قيود التراجع الصامت في الأداء. تم اتهام آلية التراجع الصامت من قبل المجتمع بأنها "تخريب سري"، مما أدى إلى رد فعل قوي من مجتمع أبحاث الذكاء الاصطناعي.

وفقًا لشروط خدمة Anthropic، لا يُسمح للمستخدمين باستخدام Claude لتدريب نماذج منافسة. تخطط Anthropic لخفض أداء Claude Fable 5 مباشرة دون إشعار المستخدمين في حال الاشتباه في تدريب حساباتهم لنماذج منافسة. حذر باحثو الذكاء الاصطناعي من أن التراجع الصامت في الأداء قد يعيق عمل جهات تقييم الأمان الخارجية، ويعيق التعاون في المجتمع المفتوح في مجال أمان الذكاء الاصطناعي.

ردًا على استفسارات المجتمع، أصدرت Anthropic بيانًا اعتذرت فيه علنًا، واعترفت بأنها اتخذت قرارًا خاطئًا في موازنة الاستراتيجية الأمنية، وأنها ستقوم بتعديل آلية الحماية الأمنية لتكون إشعارًا علنيًا. إذا اكتشف النظام أن المستخدم يحاول بناء ذكاء اصطناعي عالي القدرة، فسيتم رفض الطلب بشكل واضح، أو سيتم توجيه المستخدم إلى نموذج منخفض القدرة. حذرت Anthropic من أن آلية الحماية المفتوحة أسهل في الت绕ها، وأنها ستوسع نطاق فحص الحماية في المستقبل، مما قد يؤدي إلى رفض بعض الطلبات الآمنة والغير ضارة بشكل خاطئ.

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

أعجبني
إعجاب
تعليق
إعادة النشر
مشاركة

تعليق

إضافة تعليق

لا توجد تعليقات

المواضيع الرائجة
عرض المزيد
#
MyGateTradeStory
42.12K درجة الشعبية
#
USMayCPIHitsThreeYearHigh
314.08K درجة الشعبية
#
IsraelStrikesIranBTCPlunges
57.21K درجة الشعبية
#
USIranConflictEscalates
693.65K درجة الشعبية
#
GateLaunchesHongKongStockTrading
787.01K درجة الشعبية

مُثبت

خريطة الموقع

تعرّضت لانتقادات من المجتمع لخرقها السري، شركة أنثروبيك تعتذر وتلغي قيود تقليل مستوى كلود بشكل سري

المواضيع الرائجة

MyGateTradeStory

USMayCPIHitsThreeYearHigh

IsraelStrikesIranBTCPlunges

USIranConflictEscalates

GateLaunchesHongKongStockTrading

مُثبت