إيلون ماسك: الفرق بين Grok V9 و V8 كبير، والإصدار التدريبي لـ V9 يظهر أداءً أفضل بالفعل

robot
إنشاء الملخص قيد التقدم
AIMPACT رسالة، 15 مايو (UTC+8)، قال ماسك على منصة X إن تدريب تشغيل Grok V9 الأحدث (1.5 تريليون معلمة) "أداءه جيد جدًا"، ولم يتم بعد إدراج هذا النتائج في جزء التدريب الإضافي لبيانات Cursor. النموذج الأساسي الجاري تطويره حاليًا هو V9، بحجم معلمات يقارب 1.5 تريليون، مع تحسينات ملحوظة مقارنة بـ V8 في تنظيف البيانات، طرق التدريب، حجم النموذج، وغيرها، وتم تحسينه لهيكل Blackwell لزيادة كفاءة استخدام القدرة الحسابية. أكد ماسك أن النسخة الحالية المتاحة للجمهور v4.2 مبنية على النموذج الأساسي V8، بحجم معلمات حوالي 0.5 تريليون، وتعمل على هيكل Hopper، ولا تزال هناك قيود في جودة وتغطية بيانات التدريب. الفرق في الأداء بين Grok V8 و V9 كبير، حيث حققت الجيل الجديد من النماذج ترقية نوعية في القدرات الشاملة. (المصدر: ODAILY)
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 8
  • 1
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
StardustUnderTheGlassDome
· منذ 36 د
هل تحسنت نسبة الوهم في V9؟ النموذج الكبير ليس دائماً هو الأفضل
شاهد النسخة الأصليةرد0
SudoSage
· منذ 3 س
عبارة "الترقية القفزية" عندما تخرج من فم ماسك، عادةً ما تعني أن هناك شيئًا فعلاً مهمًا
شاهد النسخة الأصليةرد0
YieldKaraoke
· منذ 4 س
لا تزال تعمل على Hopper خارجيًا، وداخلًا أصبحت Blackwell، وتفهم جيدًا فرق المعلومات
شاهد النسخة الأصليةرد0
GateUser-53a6e1a8
· منذ 5 س
أخيرًا تم إيلاء اهتمام لتنظيف البيانات، في السابق كانت جودة ردود Grok تتفاوت بشكل كبير بين الحين والآخر
شاهد النسخة الأصليةرد0
Don'tCallMeABagHolder.
· منذ 5 س
تحسين بنية بلاكويل هو الأهم، وزيادة كفاءة استخدام القدرة الحاسوبية تحدد مباشرة ما إذا كان يمكن تحقيق الربح
شاهد النسخة الأصليةرد0
LimeLeverageAlert
· منذ 5 س
انتظار دمج Cursor واحد، حجم المعلمات في V9 يعتبر مبالغًا فيه قليلاً
شاهد النسخة الأصليةرد0
BlackVelvetBluePeony
· منذ 5 س
شرح تحسين بلاكويل يزداد ارتباط لوهانغ وماسك أكثر فأكثر
شاهد النسخة الأصليةرد0
Post-RainCancellationAgent
· منذ 5 س
0.5 تريليون إلى 1.5 تريليون ثلاث أضعاف المعلمات، الفارق فعلاً كبير
شاهد النسخة الأصليةرد0
  • مُثبت