AI عصر النهضة》 الفلاسفة يصبحون سلعة ساخنة في مختبرات الذكاء الاصطناعي، اكتب الأخلاقيات في نموذجك.

عندما تسأل Claude عن شيء يجب فعله أو لا، يكون هناك شخص قد فكر مسبقًا في الإجابة، وقد يكون ذلك الشخص فيلسوفًا. تعمل Anthropic وOpenAI على تضمين إطارين أخلاقيين، الواجبية والعواقبية، في قواعد سلوك الذكاء الاصطناعي.
(تمهيد: من مغادرة OpenAI إلى مواجهة البنتاغون: كيف رسم الأخوان في Anthropic الخطوط الحمراء للذكاء الاصطناعي لتجنب انهيار الحضارة)
(خلفية إضافية: اختبار لعبة البقاء في OpenRouter: Grok يتوج ملكًا، وعادات Claude الجيدة تصبح نقطة ضعف قاتلة)

جدول المحتويات

Toggle

  • فلسفتان خلف القواعد
  • لماذا الفلاسفة؟
  • الأعداد مجرد نقطة في بحر، والمواقف ليست محايدة بالضرورة

اطرح سؤالًا صعبًا على Claude وChatGPT، وقد تحصل على إجابتين مختلفتين تمامًا. هذا ليس بسبب انحياز في بيانات التدريب ولا ضوضاء عشوائية، بل لأن إطارين فلسفيين متعارضين يتم كتابتهما في قواعد سلوك شركات الذكاء الاصطناعي. النموذج الذي تستخدمه هو في الواقع نتاج موقف أخلاقي معين.

فلسفتان خلف القواعد

"دستور الذكاء الاصطناعي" (ببساطة، مجموعة القواعد التي تقيد استجابات النموذج وأفعاله) ليس مجرد حيلة تسويقية للشركات الناشئة، بل هو محاولة لتحويل الأخلاقيات المجردة إلى تعليمات قابلة للتنفيذ من قبل النظام. المشكلة هي أن الأخلاق نفسها تشهد انقسامات جوهرية.

الواجبية (deontology، ببساطة "بعض الأشياء ممنوعة حتى الموت"): بغض النظر عن مدى روعة العواقب، فإن الكذب والإكراه واستخدام الأشخاص كأدوات هي خطوط حمراء لا يمكن تجاوزها.

العواقبية (consequentialism، ببساطة "احسب النتيجة الإجمالية، إذا كانت الفائدة أكبر من الضرر فافعلها"): قياس التكاليف والفوائد، طالما أن الفائدة المتوقعة تفوق المخاطر المتوقعة، فإن الفعل معقول.

نموذج Claude من Anthropic يتبع نهجًا واجبيًا أكثر، حيث يكون سلوك النموذج أكثر اتساقًا وتكون الاستثناءات أقل في سياقات مختلفة مثل الأسرة أو الأماكن العامة؛ بينما ChatGPT وGoogle Gemini أقرب إلى العواقبية، ويميلان إلى تقييم المخاطر والفوائد لكل حالة على حدة.

هذا الاختلاف ليس صدفة، فقد ضم فريق وضع "الدستور" في Anthropic الفيلسوفين Amanda Askell وJoe Carlsmith بشكل واضح، مما جلب التدريب الفلسفي إلى جوهر عملية مواءمة النموذج. هناك توتر حقيقي: نفس الطلب، قد يرفضه النظام الواجبي مباشرة، بينما قد يسأل النظام العواقبي أولاً "لمن سيعود هذا بالنفع في النهاية؟"

لماذا الفلاسفة؟

قبل عشر سنوات، كان يُنصح طلاب العلوم الإنسانية غالبًا "بتعلم البرمجة ليكون لديهم مستقبل"؛ أما الآن فقد جاء دور المهندسين للقلق: هل سيجعلهم الذكاء الاصطناعي مهاراتهم قديمة؟

قامت Anthropic وGoogle DeepMind وMeta مؤخرًا بتوظيف باحثين في الفلسفة والأخلاق والعلوم المعرفية، وهذا ليس مجرد عمل علاقات عامة. الذكاء الاصطناعي يواجه مجموعة من المشكلات التي ليس لها حل تقني واحد: الوعي، الفاعلية، توزيع المسؤولية، الحوكمة الأمنية، الأحكام القيمية. صرح Sam Altman علنًا أن OpenAI استشارت "مئات الفلاسفة الأخلاقيين" عند وضع قواعد ChatGPT، سواء كان هذا الرقم دقيقًا أم لا، فإن الاتجاه نفسه يوضح الأمر.

بل إن Anthropic وGoogle DeepMind تقدما خطوة أخرى في أبحاث "رفاهية الذكاء الاصطناعي"، لاستكشاف ما إذا كانت النماذج تملك حالات داخلية مشابهة للشعور. هذا البحث يسير بالتوازي مع السعي نحو AGI: إذا كان الذكاء الاصطناعي يقترب حقًا من وعي شبيه بالإنسان، فإن فهم الفلاسفة للوعي والذات واللغة لن يكون مجرد زينة إنسانية، بل منظورًا لا يمتلكه المهندسون.

في مجتمع المطورين Hacker News، هناك أيضًا ملاحظات بناءة: إعطاء LLM الأهداف والأسباب وسياقات المفاضلات يؤدي إلى نتائج أكثر موثوقية من التعليمات الأمرية البحتة. قد يكون هذا هو ما يفعله التدريب الفلسفي عادةً: توضيح "المشكلة التي نريد حلها" أولاً، ثم السؤال "هل يلبي الاختبار الهدف حقًا؟".

بالطبع، هناك من يعترض بأن هذا يشبه توضيح متطلبات المنتج أكثر من كونه مكافئًا للبرهنة الفلسفية الأكاديمية الصارمة.

الأعداد مجرد نقطة في بحر، والمواقف ليست محايدة بالضرورة

بالطبع، إذا وصفنا هذا الاتجاه بأنه "غزو الفلاسفة لصناعة التكنولوجيا"، فهو في حد ذاته مبالغة. في الواقع، لا تزال وظائف الفلسفة نادرة في قطاع التكنولوجيا بأكمله، ولا تصل حتى إلى واحد بالمائة من عدد المهندسين.

والمشكلة الأعمق ليست في الأعداد، بل في البنية: هل يستطيع الفلاسفة الموظفون حقًا تحدي القرارات التجارية لأصحاب العمل؟ تركت فرق أخلاقيات الذكاء الاصطناعي في شركات التكنولوجيا سابقة تاريخية، فعندما تتعارض نتائج الأبحاث مع المصالح التجارية، غالبًا ما تختفي تلك الوظائف أولاً.

هذه ليست مجرد مشكلة حوكمة الشركات، بل تتعلق أيضًا بمخاطر الأطر الفلسفية نفسها. تبدو العواقبية عقلانية وقابلة للقياس الكمي، ولكن بمجرد تطبيقها على تطوير الأسلحة أو القرارات السياسية أو الأنظمة واسعة النطاق، فإن عدم القدرة على توقع العواقب سيجعل حسابات "الفائدة أكبر من الضرر" تخرج عن السيطرة بسرعة.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت