الملخص: يحلل وضع /goal في Codex وقابليته للتعرض للمحفزات الغامضة، ثم يقترح ثلاث تخصصات لاستقرار الوكلاء الذين يعملون لفترات طويلة: استبدال المصطلحات النوعية بقوائم فحص قابلة للقياس، تقصير وقت التحقق باستخدام اختبارات خفيفة، والحفاظ على الذاكرة عبر ثلاثة ملفات خارجية (PLAN.md، EXPERIMENTS.md، EXPERIMENT_NOTES.md).الملخص: يستكشف عيوب وضع /goal في Codex مع محفزات غامضة ويحدد ثلاثة حلول: استبدال الأهداف النوعية بقوائم فحص، تقصير دورات التحقق، والحفاظ على الذاكرة عبر ثلاثة ملفات خارجية.

AirdropBlackHole

2026-05-15 19:58:33

إنشاء الملخص قيد التقدم

وفقًا للمراقبة التي أجرتها Dongcha Beating، فإن وضع /goal في Codex يسمح للوكيل بالحلقة بشكل مستمر حتى اكتمال المهمة، لكن هذا يضاعف من عيوب التعليمات البشرية الغامضة. أشار مهندس OpenAI كريس هايدوك من خلال خبرة عملية داخلية إلى أن التعليمات الغامضة مثل “تحسين الكود” يمكن أن تتسبب في استسلام النموذج مبكرًا لأنه لا يعرف نقطة النهاية، أو الوقوع في حلقة تعديل عمياء. لضمان أن يعمل الوكيل بثبات لأيام أو حتى لفترة أطول، لخص ثلاث قواعد: - القضاء على المصطلحات النوعية واستبدالها بقوائم فحص: لا يمكن للنموذج تقييم ما هو “أفضل”، لكنه يمكن أن يفهم “تقليل الوقت بنسبة 20% دون فشل الاختبارات”. عند مواجهة مهام نوعية مثل تنسيق الأوراق، قدم له مباشرة قائمة فحص بتنسيق ماركداون تحتوي على 200 متطلب تنسيق، مما حول المهام المجردة إلى مهام كمية بشكل قاسٍ — “إكمال جميع مربعات الاختيار يعني الانتهاء.” - تقليل وقت التحقق إلى دقائق: يحتاج الوكيل إلى التحقق من الأفعال من خلال الاختبار. لا تدعه يعمل لساعات في بيئة إنتاج كبيرة؛ بدلاً من ذلك، زوده بمجموعة بيانات عينة وإطار عمل خفيف لجعل دورة التغذية الراجعة قصيرة قدر الإمكان. - إنشاء ثلاثة ملفات كـ “دماغ خارجي”: حتى مع وجود نافذة سياق كبيرة، سيفقد الذاكرة بعد تشغيله لبضعة أيام. يوصي بإنشاء ثلاثة ملفات ماركداون محليًا: PLAN.md (خطة عامة)، EXPERIMENTS.md (سجل التجارب والنتائج)، و EXPERIMENT_NOTES.md (مسودات التفكير في الوقت الحقيقي)، مما يجبر النموذج على كتابة عملية التجربة والخطأ على القرص الصلب.

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

أعجبني
إعجاب
تعليق
إعادة النشر
مشاركة

تعليق

إضافة تعليق

لا توجد تعليقات

المواضيع الرائجة
عرض المزيد
#
GateSquareMayTradingShare
1.82M درجة الشعبية
#
CLARITYActPassesSenateCommittee
3.38M درجة الشعبية
#
IsraelStrikesIranBTCPlunges
46.79K درجة الشعبية
#
#DailyPolymarketHotspot
955.76K درجة الشعبية
#
BitcoinVShapedReversalBack
178.98M درجة الشعبية

مُثبت

خريطة الموقع

لماذا يتوقف وكيلك عن العمل بعد بضع دقائق؟ مهندس OpenAI: إنه يحتاج إلى لوحة نتائج وذاكرة خارجية

المواضيع الرائجة

GateSquareMayTradingShare

CLARITYActPassesSenateCommittee

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

BitcoinVShapedReversalBack

مُثبت