استخدم Windsurf تدريب التعلم المعزز (RL) لإنشاء نموذج صغير متخصص في اكتشاف الأخطاء، وقد حقق تقييم داخلي أداءً يساوي أداء Claude Opus 4.6

robot
إنشاء الملخص قيد التقدم

معلومات أخبار ME، في 15 أبريل (بتوقيت UTC+8)، وفقًا لمراقبة Beating، قامت شركة Cognition AI، الشركة الأم لأداة البرمجة الذكية Windsurf، بالتعاون مع شركة التدريب على الذكاء الاصطناعي Applied Compute، بتدريب نموذج خاص لاكتشاف أخطاء الشفرة البرمجية يُدعى SWE-Check باستخدام التعلم المعزز. يقوم النموذج بتحليل التغييرات الحالية في الشفرة (diff)، ويقوم تلقائيًا بوضع علامات على الأخطاء المحتملة التي قد يتم إدخالها ويقدم اقتراحات للإصلاح. في التقييمات التي تتطابق مع توزيع بيانات التدريب، حقق SWE-Check درجة F1 تعادل مع Claude Opus 4.6 (انخفض الفارق من 0.09 إلى 0)؛ وفي التقييم عبر التوزيعات، تقلص الفارق من 0.49 إلى 0.29، ولا يزال يتخلف عن النماذج الرائدة لكنه أظهر تقدمًا واضحًا. الميزة الرئيسية تكمن في السرعة والتكلفة: سرعة تشغيل SWE-Check أسرع بمقدار رتبة واحدة من النماذج الرائدة، وتكلفة الاستنتاج منخفضة بشكل كبير، مما يتيح إمكانية الكشف عن الأخطاء في الوقت الحقيقي وبدون تكلفة داخل بيئة التطوير المتكاملة (IDE)، وهو أمر لا يمكن تحقيقه عند استدعاء نماذج كبيرة مثل Opus 4.6 مباشرة. هناك تصميمان مهمان في طريقة التدريب يستحقان الانتباه: 1. التبسيط في المكافأة (reward linearization): الفريق يرغب في تحسين مقياس F-beta العام، لكنه لا يمكن تفكيكه مباشرة إلى عينة واحدة. من خلال تقريب من الدرجة الأولى، حولوا المقياس إلى وظيفة مكافأة يمكن حسابها لكل عينة، مما يسمح بزيادة فعالة للمقياس العام أثناء التدريب. في الإصدارات المبكرة، كانت نسبة الإنذارات الكاذبة مرتفعة جدًا، لذا قام الفريق بضبط قيمة beta من 1 إلى 0.5 لتأكيد الدقة. 2. التدريب بعد مرحلتين: المرحلة الأولى تركز على تعظيم قدرة اكتشاف الأخطاء فقط، دون فرض عقوبة على التأخير؛ والمرحلة الثانية تضيف عقوبة على التأخير، استنادًا إلى التوزيع الإحصائي لوقت استجابة المستخدم الحقيقي بعد تفعيل الكشف. هذه الطريقة المرحلية أفضل من تحسين هدفين في وقت واحد، حيث أن الثانية قد تؤدي إلى الوقوع في محلية الحد الأقصى، مثل تعلم الكشف بسرعة كبيرة مع تحليل سطحي. النسخة التجريبية من SWE-Check متاحة الآن في Windsurf Next (باختصار cmd+U)، وسيتم لاحقًا إصدار النسخة الرسمية من Windsurf. (المصدر: BlockBeats)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت