قوقل تقترح منهجية تقييم مستمرة للهندسة لمواجهة تحديات تقييم بيئة إنتاج وكلاء الذكاء الاصطناعي

robot
إنشاء الملخص قيد التقدم

أخبار ME: رسالة، 4 أبريل (UTC+8)، وفي الآونة الأخيرة، ذكرت GoogleCloudTech في منشور أنه في بيئات الإنتاج الاعتماد على المحادثات اليدوية والانطباعات الذاتية (أي “فحص الأجواء”) لتقييم وكلاء الذكاء الاصطناعي غير موثوق، وقد يؤدي إلى كوارث. وتذهب وجهة النظر الواردة في المقال إلى أن الخصائص الاحتمالية للذكاء الاصطناعي التوليدي تجعل أي تغييرات صغيرة في الموجهات أو أوزان النموذج قد تؤدي إلى تدهور كبير في الأداء. ولحل هذه المشكلة، يقترح المقال نهجًا هندسيًا يطبق التقييم المستمر (CE). تميّز هذه الطريقة بين وضعين لهندسة الذكاء الاصطناعي: وضع الاستكشاف (المختبر) ووضع الدفاع (المصنع). يركز وضع الاستكشاف على إيجاد إمكانات النموذج من خلال عدد قليل من الأمثلة وفحص الأجواء؛ بينما يركز وضع الدفاع على الاستقرار، عبر التقييمات المبنية على مجموعات البيانات والبوابات الصارمة والمؤشرات الآلية لضمان أن يحقق النظام أهداف مستوى الخدمة (SLO). يحذر المقال من أن العديد من الفرق قد تبقى لفترات طويلة عالقة في وضع الاستكشاف. كما يورد في المقال مثالًا على نظام متعدد الوكلاء موزعًا (نظام منشئي الدورات) تم بناؤه بالاعتماد على Cloud Run وبروتوكول Agent2Agent، ليوضح ممارسات وضع الدفاع لإجراء نشر موثوق وقابل للتوسع على مستوى الإنتاج للذكاء الاصطناعي عبر التركيز على مبدأ فصل المسؤوليات ووكلاء متخصصين (مثل الباحث، والقاضي، وبنّاء المحتوى، والمنسق). (المصدر: InFoQ)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.24Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.24Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.23Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.23Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.22Kعدد الحائزين:1
    0.00%
  • تثبيت