شركة سينا تفتح مصدر VibeThinker-3B: يمكن ضغط التفكير، لكن لا يمكن ضغط المعرفة الواقعية

robot
إنشاء الملخص قيد التقدم
ME News أخبار، في 28 يونيو (UTC+8)، أصدرت Sina نموذج VibeThinker-3B الذي يمتلك 3 مليارات معلمة فقط، وهو يتفوق على نماذج أكبر بـ200-333 مرة مثل DeepSeek V3.2 في معايير الرياضيات والبرمجة مثل AIME26، ويتجاوز جميع النماذج التي تقل عن 20 مليار معلمة في LiveCodeBench، ويفوق GPT-5.2 وKimi K2.5 وغيرها في حل 123/128 سؤالاً في مسابقة LeetCode. لكنه يتخلف بشكل كبير في GPQA-Diamond كثيف المعرفة. النموذج مبني على Alibaba Qwen2.5-Coder-3B، وتم تدريبه بعدة مراحل مثل SFT والتعلم المعزز والتقطير الذاتي. طرح البحث "فرضية ضغط المعلمات والتغطية": التفكير المنطقي يعتمد على أنماط قليلة قابلة للضغط، بينما المعرفة العالمية الواسعة لا تزال تتطلب معلمات كبيرة. النموذج مفتوح المصدر. 🔗 قراءة الأصل:
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت