اليوم قضيت يومًا كاملاً في تشغيل أتمتة Codex.


أكبر انطباع لدي:
أكثر ما يميز الوكيل،
ليس أنه يقوم تلقائيًا بجميع المهام.
بل أنه يواصل دفع مجموعة من المهام العالقة في الطريق،
إلى نقطة تفتيش واضحة التالية.
اليوم قام بعدة أنواع من الأعمال:
1. من يستطيع كتابة الكود، يدخل مباشرة إلى شجرة العمل النظيفة ويصلح.
مثل خطأ في حكم خاطئ لمُجمّع ويكي،
يصلحه أولاً في شجرة العمل النظيفة،
وبعد التحقق من الصحة،
يوافق على cherry-pick إلى المستودع الرئيسي.
2. من يمكنه التحقق، يقوم مباشرة بتحديث الأدلة.
مثل فحص preflight للاستراتيجية، وwatch artifacts، وdashboard،
سيعيد التحقق من الحاجز القديم،
ثم يكتب النتائج إلى البوابة الحالية.
3. من يحتاج إلى قرار مني، يُنشئ بطاقة قرار.
مثل ما إذا كان يجب تقديم KYC،
أو إذا كان يجب نشر استفسار عن الشريك،
أو مسح نافذة المستودع غير النظيفة.
هذا مهم جدًا.
سير عمل الوكيل الجيد،
الجوهر ليس "التنفيذ التلقائي الكامل".
الجوهر هو:
أنه يواصل دفع المهام ذات المخاطر المنخفضة؛
ويوقف عند المهام ذات المخاطر العالية،
ويختصر القرارات إلى جملة أستطيع الموافقة عليها أو رفضها.
اليوم أيضًا وقعت في بعض الحفر:
شجرة العمل غير النظيفة تتعطل عند التكامل؛
السجلات الطويلة تستهلك السياق بشكل كبير؛
تحديث الحواجز القديمة بشكل متكرر يضيع الرموز؛
الخادم الذي يخرج بشكل غير نظيف يترك قفلًا قديمًا.
لذا قمت أخيرًا بتعديله إلى طبقتين:
طبقة دائمة:
تقوم بمسح خفيف كل 15 دقيقة،
تراقب فقط الأدلة الجديدة، والأقفال، وطابور القرارات، والطابع الزمني للمهمة.
طبقة عميقة:
فقط عندما يحدث محفز حقيقي،
يختار مهمة واحدة للتقدم إلى الالتزام، أو التقرير، أو التحليل، أو بطاقة القرار، أو الانتظار لعينة.
عند تشغيل هذه المنظومة،
تبدو أكثر كمدير مشروع مبتدئ + مهندس.
هي لا تحل محلي محل قرارات المنتج،
لكنها تواصل تنظيف قائمة المهام،
وتحول المشاكل الغامضة إلى أدلة واضحة،
وتحول النقاط العالقة غير الظاهرة إلى قرارات واضحة.
أنا الآن أعتقد أكثر فأكثر:
القدرة الأساسية في سير العمل الشخصي في المستقبل،
ليست "هل يمكنني استخدام الذكاء الاصطناعي لكتابة الكود".
بل هل يمكنك تصميم نظام مهامك،
ليتمكن الوكيل من دفعه باستمرار بشكل قابل للاستمرار.
شاهد النسخة الأصلية
post-image
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت