تكشف NVIDIA عن تحليل تكاليف بلاكويل: تكاليف وحدة المعالجة الرسومية تتضاعف، وتكاليف الرموز أقل بـ 35 مرة

وفقًا للمراقبة التي أجرتها Dongcha Beating، قام مدونة NVIDIA بتحليل اختيار معدات الاستدلال، مع تلخيص الحجة الأساسية في جملة واحدة: يجب أن يركز تقييم بنية الاستدلال التحتية على “تكلفة لكل رمز” بدلاً من “تكلفة لكل GPU في الساعة”. من حيث أسعار وحدات معالجة الرسومات، فإن Blackwell أغلى؛ ومع ذلك، عند مقارنة تكاليف الرموز، يتفوق Blackwell بشكل كبير على الجيل السابق. تستخدم المدونة نموذج DeepSeek-R1 (نموذج استدلال MoE) كموضوع اختبار، وتقارن بين Blackwell (GB300 NVL72) والجيل السابق Hopper (HGX H200). استنادًا إلى أسعار الإيجار المرجعية في سوق السحابة، تكلف Blackwell 2.65 دولار لكل GPU في الساعة، وهو تقريبًا ضعف تكلفة Hopper التي تبلغ 1.41 دولار، لكن إنتاج الرموز لكل ثانية لكل GPU يقفز من 90 إلى 6000، مما يؤدي إلى زيادة في الإنتاجية بمقدار 65 مرة. ونتيجة لذلك، تنخفض تكلفة كل مليون رمز من 4.20 دولارات إلى 0.12 دولار. كما أن إنتاج الرموز لكل ميغاواط يزيد بمقدار 50 مرة. من المهم ملاحظة أن الرقم 0.12 دولار يعتمد على تفعيل العديد من التحسينات البرمجية بشكل كامل، بما في ذلك الاستدلال منخفض الدقة FP4 و MTP (توقع متعدد الرموز، الذي يسمح للنموذج بتوليد عدة رموز في وقت واحد لزيادة السرعة). تظهر البيانات الأصلية من SemiAnalysis InferenceX v2 أن نفس GB300 NVL72 الذي يعمل بنموذج DeepSeek-R1، بدون MTP، يكلف حوالي 2.35 دولار لكل مليون رمز، وينخفض إلى حوالي 0.11 دولار مع تفعيل MTP، مما يبرز فرقًا بمقدار 21 مرة بسبب هذا التحسين الواحد. جميع النتائج المذكورة أعلاه من اختبارات نموذج DeepSeek-R1 المفرد، وقد تختلف الأرقام تحت هياكل وأحجام نماذج مختلفة.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت