إثبات النظريات بدأ أيضًا في المنافسة على التكلفة: ميسترال تفتح مصدر ليانسترال 1.5، حوالي 4 دولارات لكل سؤال.

وفقًا لرصد Beating، قامت Mistral AI بفتح مصدر Leanstral 1.5، وهو نموذج موجه للإثباتات الرسمية في Lean 4.
إجمالي عدد معلمات النموذج 119 مليار، وعدد المعلمات النشطة حوالي 6.5 مليار، بموجب ترخيص Apache-2.0، مع توفير وصول مجاني لواجهة API.
أظهرت التقييمات الرسمية أن Leanstral 1.5 حل 587 سؤالًا من أصل 672 سؤالًا في PutnamBench؛ وبلغ 87% و34% على التوالي في معايير الجبر التجريدي FATE-H و FATE-X، محطمًا أفضل أداء للنماذج المماثلة.
متوسط تكلفة حل الأسئلة لـ Leanstral 1.5 في PutnamBench يبلغ حوالي 4 دولارات، وهو أقل من تكلفة بعض الأنظمة السابقة التي تتراوح بين عشرات ومئات الدولارات.
مع زيادة ميزانية الرموز المميزة لكل سؤال، يستمر عدد حلوله في الزيادة؛ في إثبات تعقيد شجرة AVL، مر النموذج بأكثر من 2.7 مليون رمز مميز للاستدلال و22 ضغطًا للسياق، وأكمل في النهاية الإثبات ذي الصلة.
بالإضافة إلى البراهين الرياضية، تم استخدام Leanstral 1.5 أيضًا للتحقق من الكود.
وجد الفريق 11 خطأً حقيقيًا في 57 مستودعًا مفتوح المصدر لـ Rust، منها 5 لم يتم الإبلاغ عنها سابقًا.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت