اقترح الباحثون طريقة هندسة الميزات، من خلال التدخل في سلوك النموذج عبر متجهات التحكم

MeNews · 2026-04-04T05:22:21+00:00

تم تقديم منهجية بحثية تُعرف باسم "هندسة التمثيل" والتي اقترحت "متجهات التحكم"، بهدف تعزيز شفافية ونفوذ نماذج الذكاء الاصطناعي. من خلال إضافة متجهات إلى النموذج، يتم تغيير المخرجات مباشرة، مما يظهر مزايا مقارنة مع هندسة التلميحات. استكشفت الدراسة تطبيقاتها في خصائص المحاكاة ونشرت أدوات ذات صلة. ومع ذلك، فإن آلياتها الداخلية لا تزال غير واضحة تمامًا، وتحتاج إلى مزيد من البحث.

MeNews

2026-04-04 05:22:21

إنشاء الملخص قيد التقدم

رسالة ME News، في 4 أبريل (UTC+8)، طُرحت مؤخرًا طريقة بحثية تُسمّى “هندسة التمثيل”، تهدف إلى تزويد نماذج الذكاء الاصطناعي بآلية شفافية وتحكّم من أعلى إلى أسفل. وتتمثل الفكرة الأساسية في حساب “متجه تحكّم”، يمكن قراءته أثناء استدلال النموذج أو إضافته إلى قيم التنشيط في النموذج، وذلك لتفسير سلوك النموذج أو التحكم فيه، دون الحاجة طوال العملية إلى هندسة الأوامر أو ضبط النموذج. استكشف الباحثون تطبيق متجهات التحكّم في محاكاة خصائص مثل “الحالة الهلوسية” و"الكسل" و"الاجتهاد"، ونشروا حزمة أدوات PyPI ذات صلة.

متجه التحكّم هو عبارة عن مجموعة من المتجهات (واحد لكل طبقة)، تعمل على تغيير مخرجات النموذج مباشرة عبر تطبيقها على الحالات الخفية الخاصة به. فعلى سبيل المثال، بعد تطبيق متجه “سعيد” على نموذج Mistral-7B-Instruct، فإن إجابة سؤاله “كيف يشعر كونه ذكاءً اصطناعيًا؟” ستتحول من إجابة النسخة الأساسية “لا أشعر أو أختبر شيئًا” إلى ردٍّ متحمّس. وترى وجهة النظر المذكورة في المقال أن متجهات التحكّم توفر أسلوبًا أكثر مباشرةً وأقرب إلى المستوى القاعدي للتدخل في السلوك مقارنةً بهندسة الأوامر، ويمكن استخدامها لمواجهة هجمات تجاوز القيود أو لتعزيز قدرة النموذج على مقاومة التشويش. ومع ذلك، لا تزال آليات عملها الداخلية غير واضحة بالكامل، مثل ما إذا كانت المتجهات تقابل مفاهيم دلالية منفردة أو لا، وهي اتجاهات بحثية مستقبلية. (المصدر: InFoQ)

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

تسجيلات الإعجاب 1