Sonnet و Opus مستشاران يرفعان من معدل نجاح مهام الوكيل الذكي

robot
إنشاء الملخص قيد التقدم

ME News أخبار، 12 أبريل (UTC+8)، مؤخرًا، أظهر اختبار أداء وكيل الذكاء الاصطناعي أن في مهمة البحث عن الوكيل (BrowseComp)، يمكن أن يؤدي اقتران نموذج Sonnet مع مستشار Opus إلى رفع معدل النجاح من 58.1% إلى 60.4%. في مهمة ترميز طرفي للوكيل (Terminal-Bench 2.0)، ارتفع الأداء من 59.6% إلى 63.4%. يرى المقال أن السبب المحتمل هو أن Opus يوفر تخطيطًا استراتيجيًا دقيقًا للغاية للمهمات الصعبة. (المصدر: InFoQ)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت