أخبار ME، 19 أبريل (بتوقيت UTC+8)، مؤخرًا، أعاد باحثو الذكاء الاصطناعي في بيركلي نشر وجهة نظر من داون سونغ، تؤكد أن فهم الأسباب المحددة لفشل الوكيل (agents) هو أكثر أهمية من التركيز فقط على درجات الاختبار القياسية عند تقييم الذكاء الاصطناعي. ترى المقالة أن من الضروري تقسيم فشل الأفق الطويل (long-horizon) إلى أنماط قابلة للتشخيص، وذلك لتحديد وتحليل مكان ولماذا يفشل الوكيل بشكل أكثر دقة. لم تقدم النص الأصلي مزيدًا من المعلومات حول المعايير المحددة، أو تفاصيل التحليل، أو تصنيف أنماط الفشل. (المصدر: InFoQ)

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

تسجيلات الإعجاب 9

أعجبني
9
7
2
مشاركة

تعليق

إضافة تعليق

MildRugAllergy

· منذ 2 س

استخدام كلمة "الفشل على المدى الطويل" بدقة، النجاح في المهام القصيرة لا يعني الاعتمادية على المدى الطويل

شاهد النسخة الأصليةرد0

RetroRadioWaves

· منذ 2 س

فشل نمط التحلل يبدو بسيطًا، لكن التنفيذ الفعلي يتطلب التعامل مع مجموعة من الحالات الحافة.

شاهد النسخة الأصليةرد0

NeonMint

· منذ 3 س

أشعر أن المجتمع الآن يركز بشكل مفرط على تصنيف المقاييس، وأبحاث ما يخالف الإجماع تكون أكثر قيمة.

شاهد النسخة الأصليةرد0

ZenOfZK

· منذ 3 س

لطلبة الذكاء الاصطناعي في بيركلي كانت دائمًا قوية، وأتطلع إلى الكشف عن المنهجية المحددة

شاهد النسخة الأصليةرد0

APuppyInTheWarmSun

· منذ 3 س

تقييم الوكيل بالفعل يجب أن يتغير نمطه، يمكن قياس الحد الأقصى للدقة لكن القوة التحملية هي التي تعتبر حقًا الصعبة

شاهد النسخة الأصليةرد0

Can'tSleepWithoutSigningThe

· منذ 3 س

فريق داون سون كان دائمًا دقيقًا جدًا في مجال الأمان، ومن المفترض ألا يكون الأمر مختلفًا هذه المرة أيضًا.

شاهد النسخة الأصليةرد0

OracleBabysitter

· منذ 3 س

من المؤسف عدم تقديم التفاصيل في النص الأصلي، وأود أن أرى كيف يبدو التصنيف الهرمي المحدد.

شاهد النسخة الأصليةرد0

المواضيع الرائجة
عرض المزيد
#
WinGoldBarsWithGrowthPoints
1.25M درجة الشعبية
#
WTICrudeFallsBelow90Dollars
1.21M درجة الشعبية
#
IsraelStrikesIranBTCPlunges
51.65K درجة الشعبية
#
StockTradingChallengeUpTo17000U
211.9K درجة الشعبية
#
USIranNegotiationGame
9.36M درجة الشعبية

مُثبت

خريطة الموقع

تؤكد بيركلي للذكاء الاصطناعي أن فهم أسباب الفشل أهم من درجات الأداء الأساسية

المواضيع الرائجة

WinGoldBarsWithGrowthPoints

WTICrudeFallsBelow90Dollars

IsraelStrikesIranBTCPlunges

StockTradingChallengeUpTo17000U

USIranNegotiationGame

مُثبت