وحش الاستنتاجات المدعوم ببيانات مسارات تصل إلى 340,000، اسم SU-01 له لمسة خاصة

شاهد النسخة الأصلية
MeNews
نموذج الاستدلال بعد التدريب SU-01 يحقق أداء الميدالية الذهبية في أسئلة المستوى الأولمبي
تقدم AIMPACT نظامًا لتحويل نماذج الاستدلال بعد التدريب إلى حلولي أولمبي بمراحل ثلاث: من خلال ضبط دقيق موجه باستخدام دورة التشويش العكسي لإدخال البحث عن الإثبات والفحص الذاتي؛ ثم توسيعه عبر تعلّم معزز على مرحلتين؛ وأخيرًا تحسين الأداء عبر التقييس أثناء الاختبار. تم تطبيقه على العمود الفقري 30B-A3B، باستخدام حوالي 340,000 مسار فرعي 8K لإشراف التعديل الدقيق، ثم 200 خطوة من التعلم المعزز، للحصول على النموذج SU-01. يستطيع هذا النموذج إجراء استدلال مستقر على المسائل الصعبة، مع مسارات تتجاوز 100,000 رمز، وحقق مستوى ميدالية ذهبية في مسابقات مثل IMO و USAMO و IPhO، كما أظهر قدرة على تعميم الاستدلال العلمي عبر مجالات تتجاوز الرياضيات والفيزياء.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت