قوقل تقترح منهجية تقييم مستمرة للهندسة لمواجهة تحديات تقييم بيئة إنتاج وكلاء الذكاء الاصطناعي

robot
إنشاء الملخص قيد التقدم

رسالة ME News، في 4 أبريل (UTC+8)، في الآونة الأخيرة، نشر GoogleCloudTech منشورًا يشير إلى أنه في بيئات الإنتاج الاعتماد على الدردشة اليدوية والإحساسات الذاتية (أي “فحص الأجواء”) لتقييم وكلاء الذكاء الاصطناعي ليس موثوقًا، وقد يؤدي إلى كوارث. يرى المقال أن خاصية الذكاء الاصطناعي التوليدي القائمة على الاحتمالات تجعل أي تغييرات صغيرة في التوجيه أو أوزان النموذج قد تؤدي إلى تراجع ملحوظ في الأداء. ولحل هذه المشكلة، تقترح المقالة منهجًا هندسيًا لتطبيق التقييم المستمر (CE). تميّز هذه الطريقة بين نمطين لهندسة الذكاء الاصطناعي: نمط الاستكشاف (في المختبر) ونمط الدفاع (في المصنع). يركز نمط الاستكشاف على البحث عن إمكانات النموذج من خلال عدد قليل من الأمثلة و”فحص الأجواء“؛ بينما يركز نمط الدفاع على الاستقرار، عبر تقييمات مبنية على مجموعات بيانات، وبوابات تحكم صارمة، ومقاييس آلية تضمن أن يحقق النظام أهداف مستوى الخدمة (SLO). يحذر المقال من أن العديد من الفرق تبقى لفترة طويلة في نمط الاستكشاف. ويورد المقال أيضًا مثالًا على نظام موزع متعدد الوكلاء (نظام منشئي الدورات) مبنيًا اعتمادًا على Cloud Run وبروتوكول Agent2Agent، ليوضح ممارسات نمط الدفاع من خلال الالتزام بمبدأ فصل الاهتمامات ووكلاء متخصصين (مثل الباحث والقاضي وبنّاء المحتوى والمنسق) لتحقيق نشر موثوق وقابل للتوسع على مستوى الإنتاج لأنظمة الذكاء الاصطناعي. (المصدر: InFoQ)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.23Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:0
    0.00%
  • القيمة السوقية:$2.24Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.24Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.23Kعدد الحائزين:1
    0.00%
  • تثبيت