Datacurve هذه الموجة من DeepSWE مفتوحة المصدر فعلاً، تغطي خمس لغات، ومتوسط عمق الإجابة 668 سطر، كما أُطلق إطار Mini-SWE-Agent، مما يتيح قياس قدرة نماذج الكبيرة على كتابة الكود في المستقبل.

شاهد النسخة الأصلية
CoinNetwork
Datacurve الذكاء الاصطناعي المفتوح المصدر المعياري DeepSWE، يبلغ حجم رمز المصدر المرجعي خمسة أضعاف SWE-Bench
Datacurve تعلن عن مصدر كود DeepSWE كمعيار برمجي ذكي، لتقييم قدرة النماذج الكبيرة على البرمجة الذاتية. المعيار يتضمن 113 مهمة، تغطي خمس لغات: TypeScript وGo وPython وJavaScript وRust، ويتطلب في المتوسط 668 سطرًا من الحلول المرجعية. متوسط طول التعليمات التحفيزية 2158 حرفًا، مع التركيز على التفكير العميق تحت تعليمات مبسطة جدًا. الاختبار يستخدم إطار العمل المفتوح Mini-SWE-Agent لضمان الموضوعية. معدل نجاح حلول GPT-5.5 هو 70%، وGPT-5.4 وClaude-opus-4.7 بنسبة 56% و54% على التوالي.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت