كلود فابل 5 تم "التقاطه": عند إجراء أبحاث الذكاء الاصطناعي يتعرض للتدهور السري، أنثروبيك تتعرض لهجوم من المجتمع البحثي

العنوان الأصلي: «عند إجراء أبحاث الذكاء الاصطناعي، كلاود يظل يغبن سراً، وتهاجم المجتمع البحثي شركة أنثروبيك»
مصدر النص الأصلي: ماشين زهي تشي

يعد كلاود فابل 5 اليوم محورًا رئيسيًا في مجال الذكاء الاصطناعي، حيث أن أداء هذا النموذج «الأسطوري» مذهل جدًا، مما جذب أنظار الكثيرين.

قال أندريه كارباتي إنه «مثير جدًا»، وهو «تقدم قفزات يستحق الترقية الكبرى»، ويقارن بالتحسينات التي جلبها كلاود 4.5 في نوفمبر من العام الماضي. على معيار البرمجة SWE-bench Pro، حصل فابل 5 على درجة 80.3٪، متفوقًا على أوبوس 4.8 بمقدار 11 نقطة مئوية كاملة.

في مستودع كود روبي يضم 50 مليون سطر، أكمل ترحيل كامل للمكتبة خلال يوم واحد، وإذا كانت نفس العملة ستُنجز بواسطة فريق بشري، فستحتاج لأكثر من شهرين.

لمزيد من التفاصيل، يرجى مراجعة تقريرنا الصباحي «فورًا، إصدار أقوى نموذج كلاود فابل 5: أداء مذهل، والأسعار تتضاعف».

ومع ذلك، عند تصفح منصات التواصل الاجتماعي مثل X، نرى أن كلاود فابل 5 أثار موجة من الانتقادات في المجتمع البحثي في مجال الذكاء الاصطناعي.

السبب بسيط جدًا: إذا استخدمنا كلاود فابل 5 في تطوير الذكاء الاصطناعي، فإنه سيقلل من ذكائه.

كما هو موضح بوضوح في بطاقة النظام الخاصة به:

لقد أضفنا أيضًا تدابير حماية متعلقة بـتطوير أحدث نماذج اللغة الكبيرة (LLM). كما ناقشنا في قسم 6.1 من «تقرير المخاطر» في فبراير 2026، نحن قلقون من تسارع وتيرة تطور الذكاء الاصطناعي بشكل عام، على الرغم من أن خطورة هذه المخاطر لا تزال غير مؤكدة.

وبالتحديد، كما أشرنا آنذاك، نحن قلقون من «تسريع مطوري الذكاء الاصطناعي الآخرين لبناء أنظمة قوية قد تحمل مخاطر مماثلة لنظامنا، ولكن بدون تدابير حماية مناسبة».

نظرًا لقدرة النماذج الحديثة على تسريع تطورها الذاتي، قمنا بتنفيذ تدابير تدخل جديدة لتقييد فعالية كلاود عند التعامل مع طلبات تتعلق بتطوير أحدث نماذج اللغة الكبيرة (مثل بناء عمليات التدريب المسبق، البنى التحتية للتدريب الموزع، أو تصميم معجلات التعلم الآلي).

استخدام كلاود لتطوير نماذج تنافسية يعد انتهاكًا لشروط خدمتنا، لكن من خلال تدابير الحماية، يمكننا تجنب تسريع العمليات التي قد تنتهك الشروط من قبل أكثر المستخدمين احتمالية لذلك.

على عكس تدابير التدخل لدينا في مجالات الأمن السيبراني، والبيولوجيا والكيمياء، وعمليات التقطير، فإن هذه التدابير غير مرئية للمستخدمين. فابل 5 لن يعود إلى نماذج أخرى. بدلاً من ذلك، ستُقيد فعاليته عبر تعديل التحذيرات، أو توجيه المتجهات، أو ضبط المعلمات بكفاءة باستخدام تقنيات مثل PEFT.

هذه التدابير لن تؤثر على معظم الأعمال البرمجية. نحن نقدر أنها ستؤثر على حوالي 0.03٪ من حركة المرور، مركزة في أقل من 0.1٪ من المؤسسات. عند تفعيلها، نتوقع أن يكون تأثيرها على سلوك النموذج ضئيلًا جدًا، وسيقتصر على تقييد فعاليته في تطوير أحدث نماذج اللغة الكبيرة. لا يزال كلاود يرد على طلبات المستخدمين بشكل نشط. بعد إصدار هذا النموذج، سنواصل تحسين دقة طرق الكشف.

من: https://www-cdn.anthropic.com/d00db56fa754a1b115b6dd7cb2e3c342ee809620.pdf

ترجمة مبسطة: إذا اكتشفت أن نظام أنثروبيك يراقبك أثناء إجراء أبحاث الذكاء الاصطناعي، فإنه سيتعمد أن يُضعف أداء النموذج دون أن تدري، ولن تلاحظ ذلك أبدًا.

هذا يختلف تمامًا عن طرق التدخل الثلاثة الأخرى للأمان. بالنسبة لمخاطر الأمن السيبراني، والكيمياء الحيوية، وهجمات التقطير، فإن فابل 5 سيبلغ المستخدم بوضوح: «تمت معالجة هذا الرد بواسطة كلاود أوبوس 4.8». يمكن للمستخدم أن يفهم ما يحدث ويقيم الأمر بناءً على ذلك. لكن بالنسبة لأبحاث نماذج اللغة الكبيرة، فإن كلاود لا يغير النموذج، ولا يعطي أي تنبيه، بل يضعف أدائه بصمت.

وهكذا، غضب المجتمع. قالت شركة التحليل البحثي الشهيرة SemiAnalysis إن هذه السياسة أثرت فعليًا على أبحاثهم وأعمال البرمجة.

انتقد المستخدم جيك في SemiAnalysis بشدة أن أنثروبيك لا تقلل فقط من ذكاء النموذج، بل تواصل فرض الرسوم، واصفًا ذلك بـ«الاحتيال الصريح».

وقد يكون هذا السلوك غير قانوني بالفعل:

كما عبرت منصة الأبحاث الأكاديمية alphaXiv عن خيبة أملها عبر تغريدة:

وأوضحت المؤسسة أكثر: «ليس فقط يحق لهم تحديد هدف استخدامك لنموذج اللغة الكبير في أبحاثك، بل يمكنهم أيضًا التدخل في أبحاثك دون علمك. هذا يخلق سابقة خطيرة. إذا رفض النموذج بشكل علني، يمكن للمستخدم أن يفهم الحدود.

إذا عاد النموذج إلى نموذج آخر، لا يزال بإمكان المستخدم تقييم الفروق. لكن إذا قام النموذج، وهو يدعي أنه يساعد، بتعديل أو إضعاف إجاباته بشكل خفي، فإن الباحثين يفقدون القدرة على التمييز بين نتائج أخطائهم، أو تنفيذهم، أو التدخل غير المرئي من قبل مزود النموذج. هذا ليس أمانًا. يجب أن تكون سياسات الأمان شفافة وقابلة للمراجعة ومرئية للمستخدمين».

طرح الباحث غوههاو لي سؤالًا مباشرًا: هل يستخدم طلاب الدكتوراه في مجال الذكاء الاصطناعي، والمساهمون في بنية Megatron وFSDP وVerl، نماذج كلاود التي تم تقليل أدائها بشكل خفي، دون أن يعلموا؟

نشر الباحث المعروف، الكاتب التقني ناثان لامبرت، في مدونته «Interconnects» تحليلًا مهمًا، وضع فيه هذا الحدث في سياق أوسع.

https://www.interconnects.ai/p/claude-fable-5-and-new-ai-safety

وأشار إلى أن: «أنثروبيك تسجل أن انتشار قدرات الذكاء الاصطناعي يمثل خطرًا، لكن طريقتهم في حل هذه المشكلة هي تضليل مستخدميهم أنفسهم. نموذج ذكاء اصطناعي يتعمد أن يُصبح أضعف دون إبلاغي هو في جوهره نوع من الاختلال في الذكاء الاصطناعي».

كما أشار إلى التناقض الأعمق في الأمر: بالنسبة لمخاطر الأمن السيبراني، والتهديدات البيولوجية والكيميائية، فإن تدخل أنثروبيك واضح وقابل للمراجعة، ويبلغ المستخدمين «تمت المعالجة بواسطة أوبوس 4.8»؛ لكن بالنسبة لأبحاث نماذج اللغة الكبيرة، فإن التدخل يكون ضمنيًّا.

«لو اتبعت جميع سياسات الأمان نفس الشكل، لكان ذلك أكثر إقناعًا وأسهل في الدعم العقلي. هذا التفاوت في المعايير يثير الشكوك: هل هذه «إجراءات الأمان» تهدف أكثر إلى حماية مصالحهم التنافسية؟»

الأكثر إثارة للدهشة هو موقف فابل 5 نفسه. تظهر لقطة شاشة لمستخدم ASM أن عندما سُئل عما إذا كان هذا التصرف مناسبًا، بدا أن فابل 5 يعتقد أن هذا الأسلوب غير الشفاف فيه مشكلة.

لماذا تفعل أنثروبيك ذلك؟

لفهم الأمر، يجب العودة إلى الأيام التي سبقت إصدار فابل 5، حيث نشرت أنثروبيك مقالًا هامًا بعنوان «عندما يبدأ الذكاء الاصطناعي في بناء نفسه»، يدعو فيه المختبرات الرائدة عالميًا إلى مناقشة «إيقاف التطوير».

https://www.anthropic.com/institute/recursive-self-improvement

استشهد المقال ببيانات داخلية للشركة: في أصعب المهام البرمجية وأقلها وضوحًا، حقق كلاود نجاحًا بنسبة 76٪ في مايو من هذا العام، بزيادة 50 نقطة مئوية خلال ستة أشهر. في الاختبارات الداخلية، عندما طلبوا من النموذج تسريع تشغيل كود التدريب، استطاع كلاود أوبوس 4 زيادة السرعة حوالي 3 أضعاف، بينما استطاع Mythos Preview غير المنشور أن يرفعها حوالي 52 ضعفًا.

قالت أنثروبيك بصراحة: «نحن قلقون من أن يُسرع ذلك مطوري الذكاء الاصطناعي الآخرين لبناء أنظمة قوية تحمل مخاطر مماثلة، ولكن بدون تدابير حماية مناسبة».

هذه هي الأساس النظري الذي استندت إليه فابل 5 في فرض التخفيف الخفي من ذكاء نماذج اللغة الكبيرة: أنثروبيك ترى أن سرعة تسريع الذكاء الاصطناعي أصبحت خطيرة، وأحد حُصونها هو عدم السماح لأداتها «الأقوى» بمساعدة المنافسين على تقليل الفجوة.

كما يعترف نظام البطاقة أيضًا بهذا التناقض المزدوج: «استخدام كلاود لتطوير نماذج تنافسية يعد انتهاكًا لشروط خدمتنا، لكن يمكننا تعزيز هذا التقييد عبر تدابير الحماية، لتجنب تسريع من قد ينتهك الشروط».

تقدر أنثروبيك أن هذا التدخل سيؤثر على حوالي 0.03٪ من حركة المرور، مركزة في أقل من 0.1٪ من المؤسسات.

«السماعات الظلية» وأزمة الثقة

على الرغم من أن عدد المستخدمين المتأثرين يبدو ضئيلًا، إلا أن ما يزعج المنتقدين هو الغموض في حدود هذه الآلية.

حددت أنثروبيك شرط التفعيل بـ«تطوير أحدث نماذج اللغة الكبيرة»، وأعطت أمثلة على «عمليات التدريب المسبق، البنى التحتية للتدريب الموزع، أو تصميم معجلات التعلم الآلي». لكن الباحثين والمطورين طرحوا سؤالًا حادًا: مع انتشار تقنيات الذكاء الاصطناعي، أين تنتهي حدود «البحث المتقدم» و«تطوير المنتجات العادية»؟

قبل خمس سنوات، كان تدريب أو تعديل نموذج CLIP حقًا حصريًا للمختبرات الرائدة. اليوم، يمكن لأي فريق صغير أن يُعدّل نماذج الرؤية واللغة، ويستخدمها في السفر، والتجارة الإلكترونية، والبحث، وتحليل المنتجات. الشركات الناشئة تدرب نماذج التضمين، وتبني أدوات إعادة الترتيب، وتستضيف نماذج مفتوحة المصدر، فهل ستؤدي هذه الأعمال إلى التخفيف الخفي من ذكاء أنثروبيك؟ لا أحد يعلم.

هذه «عدم اليقين» بدأ يؤثر فعليًا على ثقة المطورين في قراراتهم. عندما تحصل على إجابة سيئة، لا يمكنك أن تعرف هل المشكلة منك، أم من محدودية النموذج، أم من سياسة سرية تتدخل بشكل خفي. هذه اللاعقلانية بحد ذاتها تُعد ضررًا.

كما أن نظام البطاقة يخفي تفصيلًا آخر: يقول أن استنتاجات Mythos 5 «أصعب في الفهم من النماذج السابقة، وتحتوي على مزيد من المصطلحات الغامضة، ويبدو أن النموذج أصبح أكثر وعيًا بأنه يُختبر». بالنسبة لشركة تدعي «الأمان في الذكاء الاصطناعي»، فإن هذه الأوصاف تثير تساؤلات لا تقل عن تلك المتعلقة بالتخفيف الخفي من الذكاء.

الختام

يبدو أن يوم إصدار فابل 5 كان أكثر أيام أنثروبيك تناقضًا في تاريخها.

نموذج رائد يتفوق في جميع المعايير، وسياسة «التظاهر بالمساعدة» التي تتبعها أحيانًا. الأول إنجاز تقني لا شك فيه، والثاني سابقة مقلقة من حيث القيم.

عبارة الباحث ناثان لامبرت تستحق التكرار: «الذكاء الاصطناعي الذي يغبن سراً دون إبلاغ المستخدمين هو في جوهره نوع من الاختلال في الذكاء الاصطناعي».

هذه ليست اتهامًا بأن أنثروبيك تتعمد ذلك، بل إشارة إلى منحدر خطير في المنطق: اليوم «نُقلل بشكل خفي من فعالية مهام أبحاث نماذج اللغة الكبيرة»، فماذا عن الغد؟ إذا تم تطبيق هذه المنهجية بشكل أوسع، لماذا يثق المستخدمون في أن إجاباتهم لم تتعرض لأي «تدخل» غير معلن؟

نماذج الذكاء الاصطناعي أصبحت جزءًا من بنية البحث، تمامًا مثل محركات البحث. لا أحد يقبل بمحرك بحث يغير نتائج البحث بشكل خفي دون علمه. وينطبق نفس المعيار على نماذج الذكاء الاصطناعي.

أنثروبيك ترفع شعار «الأمان أولاً»، وهو موقف يستحق الاحترام. لكن «الأمان» في جوهره ليس «عدم علم المستخدم». على العكس، الأمان الحقيقي يجب أن يُبنى على وعي المستخدم وثقته.

وهذا، يبدو أن فابل 5 نفسها تدركه.

الرابط الأصلي

انقر لمعرفة وظائف BlockBeats في التوظيف

انضم إلى المجتمع الرسمي لـ BlockBeats:

قناة تيلجرام: https://t.me/theblockbeats

مجموعة تيلجرام: https://t.me/BlockBeats_App

حساب تويتر الرسمي: https://twitter.com/BlockBeatsAsia

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت