تسميم البيانات يتفشى» تقرير أمن المعلومات المكون من 44 صفحة لمكتب التدقيق أمانة يانغ تم كشفه: من بين 27 اقتباسًا، 16 منها من اختلاق الذكاء الاصطناعي

شركة مراقبة الذكاء الاصطناعي GPTZero تكشف عن تقرير أمني من 44 صفحة لشركة المحاسبة الكبرى إرنست ويونغ (EY) كندا، حيث تبين أن 27 من 44 مرجعًا تم استشهادها تحتوي على أوهام ذكاء اصطناعي (معلومات مختلقة أو غير فعالة)، وأن حوالي 72% من التقرير تم توليده بواسطة الذكاء الاصطناعي.
(ملخص سابق: ولاية ميسوري ترفع دعوى رسمية على CoinFlip: أجهزة الصراف الآلي للعملات المشفرة أداة للاحتيال وغسل الأموال، بأقصى مطالبة تعويض تبلغ 1.826 مليون دولار)
(معلومات إضافية: كندا تدرس تشريعًا يمنع أجهزة الصراف الآلي للعملات المشفرة: 4000 جهاز، أول حالة في مجموعة السبع، وتحديد السياسات بناءً على بيانات FINTRAC)

فهرس المقالة

تبديل

  • مليارات 2000 التي أُسقطت في خطأين متناقضين
  • عندما تحل نماذج اللغة الكبيرة محل Google Scholar
  • تسميم البيانات: مخاطر منهجية جديدة لأدوات البحث بالذكاء الاصطناعي

أطلقت شركة مراقبة الذكاء الاصطناعي GPTZero تحقيقًا علنيًا في منتصف مايو، حيث اكتشفت أن شركة إرنست ويونغ كندا (EY Canada) أصدرت نهاية عام 2025 تقريرًا بعنوان "نقاط الهجوم: كشف التهديدات السيبرانية والاحتيال في أنظمة الولاء"، وهو ورقة بيضاء من 44 صفحة حول أمن نظام نقاط الولاء، تحتوي على عيوب جوهرية.

قام GPTZero بمراجعة كل مرجع من 27 مرجعًا، ووجد أن 16 منها أوهام، أي أكثر من 70%. لا يحتوي التقرير على ملاحظات علمية، بل يعتمد على إشارات داخل النص، ويحتوي على جدول "المصادر" في الصفحات 41 إلى 43، يذكر عناوين المصادر، الوصف، URL، وبعضها يذكر الناشر والتاريخ.

المشكلة تكمن في هذا الجدول: تقريبًا جميع روابط URL إما غير فعالة أو غير موجودة أصلًا، وأكثر من نصف عناوين المصادر لا تتطابق مع أي مصدر حقيقي. وبذلك، تم تصنيف حوالي 72% من محتوى التقرير على أنه مولد بواسطة الذكاء الاصطناعي.

مليارات 2000 التي أُسقطت في خطأين متناقضين

المشكلة المباشرة في هذا التقرير هي أن رقمين متناقضين بشكل يصعب تصديقهما يُنسبان لنفس الشخص.

الملخص التنفيذي يزعم أن "حجم سوق نقاط الولاء العالمية يصل إلى 200 مليار دولار"، مع الإشارة إلى أن 30 إلى 50% من النقاط لم تُستخدم أبدًا. لكن الصفحة 10 من التقرير تقول إن "200 مليار دولار" هو القيمة الإجمالية للنقاط غير المستبدلة. إذا كانت 50% من النقاط غير مستبدلة وتساوي قيمتها 200 مليار دولار، فإن حجم السوق العالمي يجب أن يكون على الأقل 400 مليار دولار، وهو تناقض بين الرقمين في الصفحتين.

الأهم من ذلك، أن كل رقم من هذين الرقمين مرفق به مرجع: واحد من فوربس مزيف، وآخر من شركة ماكينزي مزيفة.

تحقق GPTZero من "شركة ماكينزي: تقرير اقتصاديات الولاء (2022)"، وهو ملف غير موجود أصلاً. قبل نصف سنة، وجدوا في مدونة مالية تقريبًا نفس الجملة، مع الإشارة إلى أن التقرير من ماكينزي مزيف.

أي أن شخصًا ما اخترع مرجعًا أكاديميًا في مدونة منخفضة الزيارات، ثم قامت شركة EY لاحقًا "بتبييض" هذا المرجع ليبدو كأنه منشور من أكبر أربع شركات محاسبة. وهذه ظاهرة تلوث سلاسل الاستشهاد.

عندما تحل نماذج اللغة الكبيرة محل Google Scholar

صاغ مهندسو GPTZero مصطلحًا لهذه الظاهرة: vibe citing. ببساطة، الباحثون أو المستشارون يتكاسلون عن التحقق من المصادر الحقيقية، ويتركون الذكاء الاصطناعي يولد مراجع، والنتيجة عبارة عن قوائم مراجع تبدو وكأنها استشهادات، لكن محتواها مختلق تمامًا.

هذه هي الحلقة الأولى من تحقيقات GPTZero. خلال الأشهر الأخيرة، أنشأوا خط أنابيب أوتوماتيكيًا لفحص تقارير الشركات الاستشارية العامة، والنتائج الأولية تظهر أن ظاهرة vibe citing أصبحت وباءً، حتى قادة الصناعة وقعوا في الفخ.

تسميم البيانات: مخاطر منهجية جديدة لأدوات البحث بالذكاء الاصطناعي

تعتبر GPTZero أن أكبر خطر من هذا التقرير هو "تسميم البيانات".

ببساطة، رفع ملفات تحتوي على معلومات زائفة على الإنترنت، يعني إدخال سموم إلى مخزون المعرفة المشترك للجميع، مما يضلل الباحثين وصانعي القرار في المستقبل. تقدم شركة EY كندا خدمات تدقيق واستشارات بملايين الدولارات سنويًا للحكومة الكندية، وعندما يكون مصدر التقرير من جهة ذات مستوى عالٍ، وتوضع الملفات على مواقع ذات حركة مرور عالية، فإن سرعة انتشار السموم تزداد، والثقة تتآكل بشكل يصعب إصلاحه.

لقد أثار هذا التقرير موجة من ردود الفعل في وسائل الإعلام الأسترالية: حيث نُشرت مقالة في صحيفة "كانبيرا تايمز" التي استشهدت بالتقرير، وتمت إعادة نشرها في أكثر من 60 صحيفة أسترالية.

أظهرت اختبارات GPTZero أن كل من Claude وChatGPT وPerplexity عند سؤالها عن "متوسط زمن اكتشاف الاحتيال في برامج الولاء" استشهدت جميعها بالتقرير المليء بالأوهام من EY. أدوات البحث العميق بالذكاء الاصطناعي تعتمد على إشارات مختلفة عن البشر عند اختيار المصادر، وتكون أكثر اعتمادًا على الصورة العامة للعلامة التجارية، مما يجعلها أكثر عرضة لتسميم البيانات.

تم استخدام أدوات كشف الأوهام من GPTZero الآن في مراجعة الأبحاث المقدمة للمؤتمرات العلمية الكبرى مثل IJCAI وICLR وICSE. سابقًا، فحصت GPTZero ملفات حكومية، وتقريرين من شركة Deloitte، وأبحاث من مؤتمرات NeurIPS وICLR.

بعد التحقيق، أزالت EY كندا هذا التقرير من موقعها الإلكتروني، وأصدرت بيانًا: "تتعامل EY كندا بجدية مع دقة جميع المحتويات التي ننشرها، ونلتزم بمسؤولية استخدام الذكاء الاصطناعي بشكل مسؤول، ونحن الآن نراجع سبب إصدار هذا التقرير."

شركة عالمية رائدة في التدقيق، تعتمد على تقرير أبيض مولد بواسطة الذكاء الاصطناعي، وتضع سمعتها على محك، فقط عندما تم كشف الأمر من قبل فريق صغير من ثلاثة أشخاص، أدركت خطورة المشكلة.

هذه ليست حالة فردية، بل ظاهرة تتكرر في الصناعة بأكملها: عندما يحل "الذكاء الاصطناعي المولد" محل "الحكم المهني"، فإن الاعتماد على العلامة التجارية يصبح هو الخطر الأكبر، خاصة فيما يتعلق بالاستشهادات.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت