حقق نموذج Sonnet المدعوم بمستشار Opus أداءً محسّنًا في تقييم SWE-bench متعدد اللغات

MeNews · 2026-04-10T10:20:48+00:00

رسالة أخبار ME News، 10 أبريل (بتوقيت UTC+8)، مؤخرًا، أظهرت نتائج اختبار قياسي أن نموذج Sonnet المزوّد بمستشار Opus حقق درجة أعلى بمقدار 2.7 نقطة في تقييم SWE-bench متعدد اللغات مقارنةً بنموذج Sonnet الذي يعمل بشكل مستقل. وفي الوقت نفسه، انخفضت تكلفة الحساب للمهام الفردية بنسبة 11.9%. تم نشر هذه المعلومة بواسطة WesRoth على Twitter. (المصدر: InFoQ)

MeNews

2026-04-10 10:20:48

رسالة ME News، 10 أبريل (بتوقيت UTC+8)، مؤخرًا، أظهرت نتائج اختبار معياري أن نموذج Sonnet المدعّم بمستشار Opus سجل درجة أعلى بمقدار 2.7 نقطة في تقييم SWE-bench Multilingual مقارنةً بنموذج Sonnet الذي يعمل بشكل مستقل. وفي الوقت نفسه، انخفضت تكلفة الحساب لمهمة واحدة بنسبة 11.9%. تم نشر هذه المعلومات بواسطة WesRoth على Twitter. (المصدر: InFoQ)

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.