مرحلة الكابوس قبل إطلاق وكيل الذكاء الاصطناعي، أخيرًا تم السيطرة عليها جزئيًا بواسطة أدوات الربط

شاهد النسخة الأصلية
MeNews
أطلقت LangSmith أكثر من 30 نموذج تقييم، ولم يعد من الضروري بدء اختبار جودة الوكيل الذكي من الصفر
أخبار ME News، 17 أبريل (بتوقيت UTC+8)، وفقًا لمراقبة 动察Beating، أطلقت منصة تطوير الوكيل الذكي المعتمد على الذكاء الاصطناعي LangChain أداة المراقبة LangSmith تحديثين: مكتبة قوالب التقييم والمقيم القابل لإعادة الاستخدام.
تقييم مدى «سهولة استخدام» وكيل الذكاء الاصطناعي هو أحد أكثر المراحل استهلاكًا للوقت في عملية التطوير حاليًا.
قد يستدعي الوكيل الأدوات الصحيحة لكن بصيغة إجابة غير مناسبة، أو يكون الحوار الأحادي طبيعيًا لكن متعدد الأدوار يتعطل، أو تكون الإجابة النهائية معقولة لكن تم استرجاع مستندات خاطئة في الخطوات الوسيطة.
يحتاج المطورون إلى وضع نقاط فحص على مستويات متعددة مثل خطوة واحدة، مسار كامل، حوار متعدد الأدوار، استدعاء أدوات محددة، وكل تقييم يمر بكتابة موجهات، ومعايرة باستخدام بيانات حقيقية، وتحسين متكرر، وغالبًا ما يستغرق الأمر أسابيع من البداية.
تقدم LangSmith الآن أكثر من 30 قالب جاهز، تغطي خمسة فئات
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت