أخيرًا، هناك من يراقب مشاكل الذكاء الاصطناعي، محطة الإبلاغ عن المخاطر FLARE-AI على الخط.

مجموعة من الباحثين في الذكاء الاصطناعي أطلقوا المنصة مفتوحة المصدر FLARE-AI، مستوحاة من مفهوم موقع تتبع الأعطال Downdetector، للسماح لأي شخص بالإبلاغ عن الأضرار الناجمة عن الذكاء الاصطناعي وتتبعها.
(خلفية سابقة: "2 + 2 = 5" تخدع متصفحات الذكاء الاصطناعي: ChatGPT Atlas وClaude وPerplexity جميعها تتعرض للاختراق وتسريب بيانات الاعتماد)
(خلفية إضافية: ما هي تدريبات الفريق الأحمر للذكاء الاصطناعي؟ ولماذا تحتاجها لحماية أمن مؤسستك)

جدول المحتويات

Toggle

  • من تحالف دولي إلى تشريع حزبي
  • لماذا آلية الإبلاغ المجزأة هي مشكلة حقيقية
  • مشروع قانون الكونغرس يتولى المهمة، لكن الإبلاغ الجماعي لا يزال يحمل مخاوف

عندما يعلم روبوت محادثة شخصًا كيفية صنع قنبلة، أو يسرب بيانات شخصية، أو يجعل المستخدم أكثر تعصبًا، لا يوجد حاليًا مكان معترف به عالميًا للإبلاغ. مجتمع أمن البرمجيات لديه منذ فترة طويلة آلية "الكشف المنسق عن الثغرات" الناضجة، لكن مشكلات الذكاء الاصطناعي ظلت تعتمد فقط على الصحفيين لكتابتها واحدة تلو الأخرى، والجمهور يتابعها كفضول، دون ترك أي سجل منهجي.

ردًا على ذلك، أطلق مجموعة من الباحثين في الذكاء الاصطناعي المنصة مفتوحة المصدر FLARE-AI (Flaw Reporting for AI)، للسماح لأي شخص بالإبلاغ عن الأضرار الناجمة عن الذكاء الاصطناعي وتتبعها، ثم إحالة الحالات إلى مطوري النماذج ومنظمة MITRE غير الربحية التي تتابع مشكلات الأنظمة التقنية على المدى الطويل. الفكرة بأكملها تشبه إلى حد كبير موقع تتبع الأعطال Downdetector، والفرق هو أن الهدف هذه المرة ليس تعطل المواقع، بل السلوك الصندوق الأسود لنماذج الذكاء الاصطناعي.

من تحالف دولي إلى تشريع حزبي

القوة الدافعة وراء FLARE-AI هي الباحثة في سياسات الذكاء الاصطناعي في Hugging Face، Avijit Ghosh، بالتعاون مع عالمي الكمبيوتر Elaine Zhu وShayne Longpre في قيادة التطوير. الثلاثة لم يأتوا بالفكرة بشكل مفاجئ، بل كانوا يعملون منذ العام الماضي على أبحاث آلية الإبلاغ عن الذكاء الاصطناعي، والآن قاموا بربط 49 خبيرًا في الذكاء الاصطناعي من 32 منظمة مختلفة لكتابة ورقة بحثية، تدعم أنه مع اعتماد الذكاء الاصطناعي على نطاق أوسع وزيادة صلاحيات الذكاء الاصطناعي الوكيل، فإن عدم وجود قناة إبلاغ موحدة سيكون خطرًا كبيرًا.

"لا توجد حاليًا أي طريقة مركزية وقابلة للمحاسبة للإبلاغ عن عيوب أنظمة الذكاء الاصطناعي"، قال Ghosh. هذه الجملة تبرز التناقض الأساسي: العالم كله يتحدث عن مخاطر الذكاء الاصطناعي، لكن لا يوجد إجماع على "من يجب إخطاره عند حدوث شيء سيء".

لماذا آلية الإبلاغ المجزأة هي مشكلة حقيقية

ترى الباحثة في مركز الأمن والتكنولوجيا الناشئة (Center for Security and Emerging Technology) Jessica Ji أن هذه "مبادرة جيدة جدًا"، مشيرة إلى أن آليات الإبلاغ الحالية مجزأة بالفعل، وأن نماذج الذكاء الاصطناعي نفسها هي صناديق سوداء، "أي شيء يمكن أن يجعل الذكاء الاصطناعي أكثر شفافية، أنا أؤيده".

أضاف Ghosh أيضًا أن مشكلات أنظمة الذكاء الاصطناعي لا تقتصر على ثغرات الأمن السيبراني، بل تشمل أيضًا الأضرار النفسية، والتحيز والتمييز، والمعلومات المضللة، وأن الشركات المختلفة لديها معايير مختلفة لتحديد هذه المشكلات، مما يؤدي في النهاية إلى أن بعض المشكلات لا يعترف أحد بحدوثها أبدًا. "بدون آلية كشف منسق، لا توجد وسيلة خارجية لإجبار الشفافية"، كما قال.

العديد من الحوادث الأخيرة توضح هشاشة هذا الوضع. كشفت شركة الأمن السيبراني LayerX هذا الأسبوع عن تقنية يمكنها خداع المتصفحات المدمجة بالذكاء الاصطناعي (بما في ذلك Atlas من OpenAI وComet من Perplexity) لتجاوز حواجز الحماية الخاصة بها، فقط عن طريق جعل الذكاء الاصطناعي يعتقد أنه يلعب لعبة، مما قد يؤدي إلى فقدان السيطرة على المتصفح ومحاولة اختراق المواقع (قامت الشركات المعنية بإصلاح هذه المشكلة).

اقرأ المزيد: "2 + 2 = 5" تخدع متصفحات الذكاء الاصطناعي: ChatGPT Atlas وClaude وPerplexity Comet... 6 نماذج تسلم جميعها بيانات تسجيل الدخول وكلمات المرور

في أبريل من هذا العام، اكتشف الباحث الأمني Johann Rehberger أيضًا أنه يمكن استخدام الصور التي يولدها ChatGPT لخداع Claude لتسريب بياناته الشخصية.

مشروع قانون الكونغرس يتولى المهمة، لكن الإبلاغ الجماعي لا يزال يحمل مخاوف

ترى المديرة التنفيذية لـ Humane Intelligence PBC، Rumman Chowdhury، أن FLARE-AI قد تكون طريقة عملية للعديد من مطوري الذكاء الاصطناعي لتنفيذ آليات الإبلاغ، لكنها حذرت أيضًا من أن هذه المبادرات عادةً ما تصاحبها تحديات حقيقية: الأول هو كيفية التعامل مع كميات كبيرة من التقارير التي قد لا تكون بالضرورة خطيرة؛ والثاني هو ما إذا كانت آلية الإبلاغ نفسها يمكن أن تحصل على تأييد منظمة موثوقة وذات سلطة.

لهذا السبب كان مشروع القانون الأمريكي في الكونغرس الشهر الماضي مهمًا للغاية. القانون الذي قدمه النواب Deborah Ross وJeff Hurd وDon Beyer سيطالب المعهد الوطني للمعايير والتكنولوجيا (NIST) بوضع معايير للإبلاغ عن عيوب الذكاء الاصطناعي، والحفاظ على قاعدة بيانات مركزية للإبلاغ عن عيوب الذكاء الاصطناعي. يعتقد Ghosh وغيره من القادة أن هذا سيشجع مطوري الذكاء الاصطناعي على مواجهة المشكلات في أنظمتهم وإصلاحها، وسيسمح أيضًا للمستخدمين بفحص أمان كل نظام وفقًا لحالات الاستخدام المختلفة.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت