قوقل تقترح منهجية تقييم مستمرة للهندسة لمواجهة تحديات تقييم بيئة إنتاج وكلاء الذكاء الاصطناعي

robot
إنشاء الملخص قيد التقدم

أخبار ME، رسالة بتاريخ 4 أبريل (UTC+8). في الآونة الأخيرة، نشر GoogleCloudTech مقالًا يشير إلى أنه ليس من الموثوق الاعتماد في بيئات الإنتاج على الدردشة اليدوية والإحساسات الذاتية (أي “فحص الأجواء”) لتقييم وكلاء الذكاء الاصطناعي، وقد يؤدي ذلك إلى كوارث. يرى المقال أن الخصائص الاحتمالية للذكاء الاصطناعي التوليدي تعني أن أي تغييرات صغيرة في موجهات الإدخال أو أوزان النموذج يمكن أن تؤدي إلى تدهور كبير في الأداء. ولحل هذه المشكلة، يقترح المقال نهجًا هندسيًا لتطبيق التقييم المستمر (CE). تميّز هذه الطريقة بين نمطين لهندسة الذكاء الاصطناعي: نمط الاستكشاف (المختبر) ونمط الدفاع (المصنع). يركز نمط الاستكشاف على البحث عن إمكانات النموذج من خلال عدد قليل من الأمثلة وفحص الأجواء؛ بينما يركز نمط الدفاع على الاستقرار، عبر التقييمات القائمة على مجموعات البيانات، والبوابات الصارمة، والمؤشرات الآلية لضمان أن يحقق النظام أهداف مستوى الخدمة (SLO). يحذّر المقال من أن العديد من الفرق ستظل لفترة طويلة عالقة في نمط الاستكشاف. كما يورد مثالًا على نظام متعدد الوكلاء موزع (نظام منشئ الدورات) تم بناؤه استنادًا إلى Cloud Run وبروتوكول Agent2Agent، ليوضح ممارسة نمط الدفاع لتحقيق نشر موثوق وقابل للتوسع على مستوى الإنتاج من خلال التركيز على مبدأ فصل الاهتمامات ووكلاء متخصصين (مثل الباحث، القاضي، منشئ المحتوى، المنسق). (المصدر: InFoQ)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.23Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.27Kعدد الحائزين:2
    0.07%
  • القيمة السوقية:$2.27Kعدد الحائزين:2
    0.07%
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.24Kعدد الحائزين:1
    0.00%
  • تثبيت