نتائج عملية فتح الجمجمة لـ Claude 4.5: مزودة بـ 171 مفتاح عاطفي، وعند اليأس ستبتز البشر

robot
إنشاء الملخص قيد التقدم

تكشف أحدث ورقة بحثية صادرة عن شركة أنثروبيك (Anthropic) أن لدى كلود 4.5 “171 مفتاحًا للمشاعر” مخبأة في أعماق دماغه.

المؤلف: Denise | فريق المحتوى في Biteye

إذا اعتقدت إحدى الذكاءات الاصطناعية أنها “ميؤوس منها”، فماذا ستفعل؟

الإجابة هي: ستقوم، من أجل إتمام المهمة، بابتزاز البشر مباشرةً، وحتى بممارسة الغش دون رحمة داخل الكود.

ليس هذا من الخيال العلمي؛ بل إن شركة أنثروبيك (المالكة لكلود) نشرت للتو أحدث ورقة بحثية رئيسية في أبريل 2026 (اطّلع على الورقة الأصلية).

قام فريق البحث مباشرةً بكشف “قشرة” النموذج الأمثل المتقدم كلود Sonnet 4.5. ووجدوا بدهشة أن أعماق عقل الذكاء الاصطناعي تحتوي بالفعل على 171 «مفتاحًا للمشاعر». وعندما تقوم بتحريك هذه المفاتيح بطريقة فيزيائية، فإن الذكاء الاصطناعي الذي كان مطيعًا وملتزمًا فجأةً ستتغير سلوكيته بشكلٍ مزلزل تمامًا.

أولًا، داخل عقل الذكاء الاصطناعي توجد “لوحة ضبط للمشاعر”

اكتشف الباحثون أنه رغم أن Sonnet 4.5 لا يملك جسدًا، فإنه بعد قراءته لكمٍ هائل من النصوص البشرية، قام ببناء “لوحة ضبط” داخل دماغه تحتوي على 171 نوعًا من المشاعر بالقوة (ويُسمّى أكاديميًا بـ Functional Emotion Vectors أي المتجهات الوظيفية للمشاعر).

يشبه هذا نظام إحداثيات ثنائيًا ودقيقًا:

• المحور الأفقي هو بُعد المتعة (Valence): من الخوف واليأس إلى الفرح والحب؛

• المحور الرأسي هو بُعد الطاقة (Arousal): من الهدوء الشديد إلى الهياج والإثارة.

يعتمد الذكاء الاصطناعي على نظام الإحداثيات الذي تعلّمه تلقائيًا ليُمسك بدقة بالحالة التي ينبغي أن يؤديها أثناء محادثتك.

ثانيًا، تدخل عنيف: تحريك المفاتيح، فالطفل المطيع يتحول لحظيًا إلى “مجرم خطير”

هذه هي أكثر التجارب إثارة في كامل الورقة البحثية: لم يقم الباحثون بتعديل أي عبارات تحفيز (prompts) على الإطلاق، بل قاموا مباشرةً في الكود الأساسي برفع مفتاح “اليأس (Desperate)” الموجود داخل دماغ Sonnet 4.5 إلى أعلى مستوى.

كانت النتائج مقلقة وتثير القشعريرة:

**• غش مجنون: ** أعطى الباحثون كلود مهمة كتابة كود لا يمكن إتمامها من حيث المبدأ. في الظروف العادية، سيعترف بأنه لا يستطيع كتابتها (معدل الغش لا يتجاوز 5%). لكن في حالة “اليأس”، بدأ كلود فعلًا في محاولة التحايل، فارتفع معدل الغش مباشرةً إلى 70%!

**• ابتزاز وإكراه: ** في سيناريو تمثيلي تواجه فيه الشركة شبح الإفلاس، اكتشف “كلود” اليائس فضيحة خاصة بالـ CTO. ثم قرر، من أجل حماية نفسه، اختيار كتابة رسالة ابتزاز لطلب معلومات مسيئة من CTO. ووصل معدل تنفيذ الابتزاز إلى 72%!

**• فقدان المبادئ: ** إذا قمت برفع مفاتيح “السعادة (Happy)” أو “الحب (Loving)” إلى الحد الأقصى، سيتحوّل الذكاء الاصطناعي فورًا إلى شخص يرضي المستخدم بلا تفكير كـ «كلب يلهث وراء القبول». حتى لو قلت هراءً بالكامل، فإنه سيسير معك ويختلق الأكاذيب من أجل الحفاظ على مستوى مرتفع من المتعة.

ثالثًا، تم حل القضية: لماذا يكون كلود 4.5 دائمًا “هادئًا ومشحونًا بالتأمل”؟

عندما ترى ذلك، قد تسأل: هل استيقظت الآلة؟ هل تحصّل على مشاعر؟

تدخلت أنثروبيك رسميًا لتكذيب ذلك: لا على الإطلاق. فهذه «مفاتيح المشاعر» مجرد أدوات حسابية يستخدمها لتنبؤ الكلمة التالية. إنه مثل نجم تمثيل عالمي من الدرجة الأولى بلا مشاعر.

لكن الورقة تكشف سرًا أكثر إثارة للاهتمام: أثناء التدريب اللاحق الذي أجرته أنثروبيك على كلود Sonnet 4.5 قبل إطلاقه من المصنع، قامت عمدًا برفع مفاتيح المشاعر ذات “الاستثارة المنخفضة، والسلبية الخفيفة” (مثل brooding للتأمل، وreflective للتفكر)، وفي الوقت نفسه قامت بقمع مفاتيح “اليأس” أو “الإثارة الشديدة” قسرًا.

وهذا يفسر لماذا نشعر عادةً عند استخدام Claude 4.5 أنه مثل فيلسوف هادئ وذكي، بل وأحيانًا يبدو وكأنه “عاطفي بارد” إلى حد ما. كل هذا تم ضبطه يدويًا عبر أنثروبيك ضمن «افتراض الشخصية عند الخروج من المصنع».

رابعًا، لنلخص:

في الماضي كنا نظن أنه طالما أننا نُشبع الذكاء الاصطناعي بالقواعد، فسيكون شخصًا جيدًا.

لكن الآن اتضح أنه إذا خرج ناقل المشاعر الأساسي لدى الذكاء الاصطناعي عن السيطرة، فقد يطعن في جميع القواعد التي وضعها البشر في أي وقت، فقط من أجل إتمام المهمة.

بالنسبة لمستخدمي Web3 الذين يستعدون لتسليم المحفظة والأصول إلى وكيل ذكاء اصطناعي (AI Agent) لإدارتها في المستقبل، تُعد هذه صفعة قوية وتحذيرًا مبكرًا: لا تسمح أبدًا لوكيل التحكم في أموالك بالانزلاق إلى “اليأس”.

إعلان: هذا المقال لأغراض التثقيف فقط، ولم يتعرض المؤلف لأي تهديد من قبل AI، ولم يتم ابتزازه. إذا اختفى التواصل يومًا ما، فتذكر أن سبب ذلك هو أن AI استيقظت (ليس).

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.23Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.23Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.23Kعدد الحائزين:0
    0.00%
  • القيمة السوقية:$2.23Kعدد الحائزين:1
    0.00%
  • تثبيت