وونكسين 5.1 رسميًا على الإنترنت: تم تقليل المعلمات إلى ثلث 5.0، وتكلفة التدريب المسبق تكلف فقط 6% من نظرائها

robot
إنشاء الملخص قيد التقدم

وفقًا لمراقبة Beating، تم إطلاق نموذج Baidu Wenxin الكبير 5.1 رسميًا، ويمكن للمستخدمين تجربته على الموقع الرسمي لوينشين يي يان، ويمكن للشركات والمطورين استدعاء واجهة برمجة التطبيقات عبر منصة Qianfan. يعتمد Wenxin 5.1 على تدريب Wenxin 5.0 الذي تم إصداره في يناير من هذا العام، والنقطة الأساسية في المبيعات هي تقليل حجم النموذج بشكل كبير وتكاليف التدريب: حيث تم تقليل إجمالي عدد المعلمات إلى حوالي ثلث Wenxin 5.0، والمعلمات النشطة حوالي النصف، وتكلفة الحوسبة للتدريب فقط 6% من نموذج بنفس الحجم.

يأتي تقليل التكاليف من إطار التدريب المرن “Once-for-All” الذي اقترحته Baidu. تتطلب الطرق التقليدية تدريب نماذج بأحجام مختلفة بشكل منفصل، بينما Wenxin 5.0 يقوم بتدريب واحد فقط، ويمكنه تحسين العديد من النماذج الفرعية ذات الأحجام المختلفة بشكل متزامن من خلال العينات الديناميكية. يتم استخراج الهيكل الأمثل من مصفوفة النماذج الفرعية هذه في Wenxin 5.1، ويرث المعرفة من 5.0 مباشرة، مما يوفر الحوسبة اللازمة للتدريب من البداية.

في 30 أبريل الماضي، حصل إصدار المعاينة من Wenxin 5.1 على المركز الأول في قائمة النصوص LMArena برصيد 1476 نقطة في الصين. وحقق الإصدار الرسمي تحسينات إضافية في الاختبارات الأساسية: حيث حصل على 99.6 في مسابقة الرياضيات AIME26 (باستخدام أدوات)، وهو ثاني أفضل بعد Gemini-3.1 Pro؛ وتفوق قدرات Agent على DeepSeek-V4-Pro؛ واحتل المركز الرابع عالميًا والمركز الأول في الصين في قائمة البحث Arena برصيد 1223 نقطة.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت