تأثير ملف AGENTS.md الذي تم اختباره بواسطة Augment Code على توليد الكود: الأفضل يعادل ترقية النموذج بمستوى واحد، والأسوأ أقل من عدم الكتابة

robot
إنشاء الملخص قيد التقدم
ME News رسالة، في 23 أبريل (UTC+8)، وفقًا لرصد Beating، قامت شركة أدوات البرمجة بالذكاء الاصطناعي Augment Code بسحب عشرات ملفات AGENTS.md من مستودعها الأحادي (monorepo)، واستخدمت مجموعة التقييم الداخلي AuggieBench لقياس تأثيرها الفعلي على مخرجات وكيل الترميز. الطريقة هي استخدام طلبات السحب (PR) عالية الجودة التي تم دمجها كمعيار، وجعل الوكيل يعيد تنفيذ نفس المهمة في ظل وجود وغياب AGENTS.md، ثم مقارنة الدرجات. كانت الفجوة أكبر بكثير من المتوقع. أفضل ملفات AGENTS.md حققت تحسينًا في الجودة يعادل استبدال النموذج من Haiku إلى Opus، بينما أسوأها كان أسوأ من عدم وجودها على الإطلاق. علاوة على ذلك، يمكن أن يكون لنفس الملف تأثيرات معاكسة في مهام مختلفة: فقد زاد من توافق إصلاح خطأ بنسبة 25%، لكنه قلل من إنجاز وظيفة معقدة في نفس الوحدة بنسبة 30%. هناك عدة قواعد للكتابة الفعالة: يجب ألا يتجاوز الملف الرئيسي 100 إلى 150 سطرًا، مع إرفاق عدة وثائق مرجعية مركزة، وفي الوحدات المتوسطة التي تحتوي على حوالي 100 ملف أساسي، يمكن أن يحقق تحسينًا شاملاً بنسبة 10% إلى 15%. أفضل طريقة هي كتابة العملية في خطوات مرقمة، حيث قللت عملية نشر من 6 خطوات من طلبات السحب التي تفتقر إلى الملفات من 40% إلى 10%، وزادت الدقة بنسبة 25%. استخدام جداول القرار لمساعدة الوكيل على اختيار الخطة الصحيحة قبل الشروع في العمل، زاد أيضًا من التوافق بنسبة 25%. عند كتابة المحظورات، يجب تقديم بدائل، فمجرد كتابة "لا" يجعل الوكيل مترددًا، وأكثر من 15 تحذيرًا متتاليًا يؤدي إلى تدهور واضح في الأداء. أسهل طريقة للفشل هي كثرة الوثائق. بمجرد أن ينجذب الوكيل إلى كميات كبيرة من الوثائق الهيكلية، بعد تحميل مئات الآلاف من الرموز المميزة، تصبح المخرجات أسوأ. إحدى الوحدات جمعت 226 وثيقة بأكثر من 2 ميغابايت، ولم يكن لـ AGENTS.md أي فائدة. بالإضافة إلى ذلك، AGENTS.md هو الموقع الوحيد للوثائق الذي يقرأه الوكيل بنسبة 100%، بينما معدل اكتشاف الوثائق تحت _docs/ غير المستشهد بها أقل من 10%. (المصدر: Beating)
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت