Sonnet و Opus مستشاران يرفعان من معدل نجاح مهام الوكيل الذكي

robot
إنشاء الملخص قيد التقدم

خبر ME News، 12 أبريل (بتوقيت UTC+8)، مؤخرًا، أظهر اختبار أداء وكيل الذكاء الاصطناعي أن الجمع بين نموذج Sonnet ومستشار Opus في مهمة البحث عن الوكيل (BrowseComp) يمكن أن يزيد معدل النجاح من 58.1% إلى 60.4%. في مهمة ترميز طرفي للوكيل (Terminal-Bench 2.0)، ارتفع الأداء من 59.6% إلى 63.4%. يرى المقال أن السبب المحتمل هو أن Opus يوفر تخطيطًا استراتيجيًا عالي الدقة للمهام الصعبة. (المصدر: InFoQ)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت