ورشة عمل Raindrop باستخدام Codex لمساعدتك في جعل وكيل الذكاء الاصطناعي الخاص بك يبحث تلقائيًا عن الأخطاء ويصلحها (مفتوح المصدر ومجاني)

شركة أدوات مطور وكيل الذكاء الاصطناعي Raindrop أطلقت هذا الأسبوع أداة تصحيح محلية مفتوحة المصدر ورشة عمل (v0.1.6)، تتيح للمطورين تتبع كل رمز token يُصدره الوكيل واستدعاءات الأدوات على الفور، ومن خلال MCP تسمح لـ Claude Code بقراءة، وكتابة الاختبارات، وإصلاح الأخطاء تلقائيًا.
(ملخص سابق: هل يخطئ Claude بشكل مجنون ويتصرف بغباء عند كتابة البرامج؟ تعديل قواعد Andrej Karpathy الـ12 لمساعدتك على تقليل معدل الأخطاء من 41% إلى 3%)
(معلومات إضافية: أطلقت Anthropic خدمة “Claude للأعمال الصغيرة”: تستهدف الشركات الصغيرة والمتوسطة في أتمتة الذكاء الاصطناعي)

نتيجة غريبة ظهرت للتو من وكيل الذكاء الاصطناعي الخاص بك. اختار أداة لم تكن متوقعة، وأصدر ردًا غامض المعنى. فتحت السجل، ورأيت سلسلة من استدعاءات API وأرقام tokens، لكن لا توجد أدنى مؤشرات على الخطأ في القرار الذي اتخذه.

في 14 مايو، أطلقت Raindrop أداة مفتوحة المصدر، تحاول أن تجعل هذا السيناريو غير ممكن الحدوث مرة أخرى: ورشة عمل تصحيح الذكاء الاصطناعي تعمل بالكامل على الجهاز المحلي، ومجانية تمامًا. تتيح للمطورين تتبع كل رمز token يُصدره الوكيل واستدعاءات الأدوات على الفور، ثم تُسلم عملية التصحيح لـ Claude Code أو Codex للقيام بها.

لماذا تعتبر مشكلة تصحيح وكيل الذكاء الاصطناعي أكثر صعوبة؟

التصحيح التقليدي للبرمجيات يتضمن نقاط توقف، وتتبع استدعاءات كاملة، ومسار تنفيذ محدد. أما تصحيح وكيل الذكاء الاصطناعي فهو مختلف. سلوكه احتمالي، نفس الإدخال قد يؤدي في تنفيذات مختلفة إلى مسارات مختلفة تمامًا؛ قراراته موزعة عبر استدعاءات متعددة لموديلات LLM، ومن الصعب جدًا استنتاج المنطق من المخرجات النهائية فقط.

جوهر المشكلة هو: أنت لا تبحث عن “أي سطر برمجي خطأ”، بل تبحث عن “القرار غير المتوقع الذي اتخذه الوكيل في سياق معين، وأي خطوة كانت سبب المشكلة”. هذه المشكلة، لا يمكن حلها باستخدام أدوات التصحيح التقليدية.

الحلول الحالية غالبًا تتبع مسارين:

  • الأول هو منصة مراقبة سحابية، ترسل تتبع العمليات إلى خدمة طرف ثالث لتحليل البيانات عبر لوحة تحكم
  • الثاني هو إدراج سجلات مخصصة داخل الكود

الخيارات الأولى غير مناسبة للمطورين الذين يراعون خصوصية البيانات، والثانية تتطلب وقتًا وجهدًا، وكل ترقية لإطار العمل تتطلب صيانة بنية تسجيل جديدة. وكلاهما لديه مشكلة مشتركة: يخبرك “ماذا حدث”، لكنه لا يساعدك على “تصحيح المشكلة”.

أما ورشة العمل، فاختارت المسار الثالث: التنفيذ بالكامل على الجهاز المحلي، بدون إرسال أي بيانات إلى خوادم خارجية، مفتوحة المصدر، ومجانية، بحيث يشارك الذكاء الاصطناعي مباشرة في دورة التصحيح.

كيف تعمل ورشة العمل

بعد التشغيل، تقوم ورشة العمل بتنفيذ واجهة مرئية على الجهاز المحلي، وتوفر خادم MCP (بروتوكول سياق النموذج). MCP يُترجم إلى “معيار اتصال يتيح لأدوات الذكاء الاصطناعي استدعاء قدرات خارجية” — وهو جسر لقراءة البيانات من أدوات التكويد مثل Claude Code.

بمجرد ربط SDK المدعوم، فإن كل عقدة تنفيذية للوكيل — كل رمز token يُصدر، كل استدعاء أداة، كل فرع قرار — تظهر بشكل تدفق مباشر على localhost:5899، بدون الحاجة إلى استعلام دوري (polling)، أو تحديث يدوي.

بعبارات بسيطة، هو كأنه نافذة مراقبة على جهازك، تتيح لك مشاهدة ما يفعله الذكاء الاصطناعي بشكل مباشر، كأنك تتابع بثًا حيًا.

التصميم الأهم في ورشة العمل هو دمج أدوات المساعدة مثل Claude Code في دورة التصحيح. نظرًا لكون ورشة العمل تكشف عن خادم MCP، يمكن لـ Claude Code قراءة محتوى التتبع مباشرة، وكتابة اختبارات تقييمية (eval)، وتشغيلها، ومراقبة الفشل في التحقق، ثم تعديل برمجية الوكيل، وإعادة التشغيل — حتى تمر جميع الاختبارات.

تسمي Raindrop هذه الحلقة بـ “حلقة تقييم ذاتية التصحيح”. العملية كاملة مغلقة على الجهاز، حيث يقرأ Claude Code التتبع، يكتب التقييم، يراقب الفشل، يعدل الكود، ويعيد التشغيل، دون تدخل يدوي من المطور في كل خطوة.

كما تدعم ورشة العمل وظيفة Replay: استرجاع التتبع من البيئة الحية، وإعادة تنفيذه على الكود الحقيقي، لإجراء اختبارات رجعية. هذا مفيد بشكل خاص عندما يحدث خطأ في بيئة الإنتاج ولا يمكن إعادة إنتاجه محليًا، حيث يمكن ببساطة تشغيل التتبع الحقيقي، وتوفير الوقت في بناء سيناريوهات إعادة الإنتاج.

CODEX‎-1.17%
TOKEN‎-0.39%
ANTHROPIC‎-2.13%
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت