لماذا يتوقف وكيلك عن العمل بعد بضع دقائق؟ مهندس OpenAI: إنه يحتاج إلى لوحة نتائج وذاكرة خارجية

robot
إنشاء الملخص قيد التقدم

وفقًا للمراقبة التي أجرتها Dongcha Beating، فإن وضع /goal في Codex يسمح للوكيل بالحلقة بشكل مستمر حتى اكتمال المهمة، لكن هذا يضاعف من عيوب التعليمات البشرية الغامضة. أشار مهندس OpenAI كريس هايدوك من خلال خبرة عملية داخلية إلى أن التعليمات الغامضة مثل “تحسين الكود” يمكن أن تتسبب في استسلام النموذج مبكرًا لأنه لا يعرف نقطة النهاية، أو الوقوع في حلقة تعديل عمياء. لضمان أن يعمل الوكيل بثبات لأيام أو حتى لفترة أطول، لخص ثلاث قواعد: - القضاء على المصطلحات النوعية واستبدالها بقوائم فحص: لا يمكن للنموذج تقييم ما هو “أفضل”، لكنه يمكن أن يفهم “تقليل الوقت بنسبة 20% دون فشل الاختبارات”. عند مواجهة مهام نوعية مثل تنسيق الأوراق، قدم له مباشرة قائمة فحص بتنسيق ماركداون تحتوي على 200 متطلب تنسيق، مما حول المهام المجردة إلى مهام كمية بشكل قاسٍ — “إكمال جميع مربعات الاختيار يعني الانتهاء.” - تقليل وقت التحقق إلى دقائق: يحتاج الوكيل إلى التحقق من الأفعال من خلال الاختبار. لا تدعه يعمل لساعات في بيئة إنتاج كبيرة؛ بدلاً من ذلك، زوده بمجموعة بيانات عينة وإطار عمل خفيف لجعل دورة التغذية الراجعة قصيرة قدر الإمكان. - إنشاء ثلاثة ملفات كـ “دماغ خارجي”: حتى مع وجود نافذة سياق كبيرة، سيفقد الذاكرة بعد تشغيله لبضعة أيام. يوصي بإنشاء ثلاثة ملفات ماركداون محليًا: PLAN.md (خطة عامة)، EXPERIMENTS.md (سجل التجارب والنتائج)، و EXPERIMENT_NOTES.md (مسودات التفكير في الوقت الحقيقي)، مما يجبر النموذج على كتابة عملية التجربة والخطأ على القرص الصلب.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت