تفاصيل تكلفة نيفيديا لإصدار بلاكويل: بطاقة الرسوميات أغلى بمقدار الضعف، وكل رمز مقابل 35 ضعف السعر السابق

robot
إنشاء الملخص قيد التقدم

وفقًا لمراقبة Beating، قامت NVIDIA بنشر مدونة تفكك وتفسير اختيار الأجهزة، والرسالة الأساسية في جملة واحدة: يجب تقييم بنية الت inference بناءً على «تكلفة كل رمز» وليس «تكلفة كل GPU في الساعة». باستخدام سعر وحدة GPU، فإن Blackwell أغلى؛ باستخدام تكلفة الرمز، فإن Blackwell يتفوق على الجيل السابق بشكل كبير.

تستخدم المدونة نموذج DeepSeek-R1 (نموذج استنتاج MoE) كهدف اختبار، وتقارن بين Blackwell (GB300 NVL72) و Hopper (HGX H200) من الجيل السابق. وفقًا لأسعار الإيجار في سوق السحابة، فإن Blackwell يكلف 2.65 دولار لكل GPU في الساعة، وهو أغلى تقريبًا بمقدار الضعف من Hopper الذي يكلف 1.41 دولار، لكن إنتاج الرمز لكل ثانية من GPU قفز من 90 إلى 6000، مع زيادة في السعة الإنتاجية بمقدار 65 مرة، مما أدى إلى انخفاض تكلفة كل مليون رمز من 4.20 دولار إلى 0.12 دولار. كما زادت إنتاجية الرمز لكل ميغاواط بمقدار 50 مرة.

الشرط المسبق الذي يجب الانتباه إليه: الرقم 0.12 دولار يعتمد على تفعيل جميع التحسينات البرمجية مثل استنتاج FP4 منخفض الدقة و MTP (توقع متعدد الرموز، حيث يُنتج النموذج عدة رموز في مرة واحدة لتسريع العملية). تظهر البيانات الأصلية لـ SemiAnalysis InferenceX v2 أنه عند تشغيل GB300 NVL72 لنموذج DeepSeek-R1، بدون تفعيل MTP، تكون تكلفة كل مليون رمز حوالي 2.35 دولار، وعند تفعيله تنخفض إلى حوالي 0.11 دولار، فقط هذا التحسين يفرق بمقدار 21 مرة. جميع الأرقام المذكورة هي نتائج اختبار لنموذج DeepSeek-R1 فقط، وقد تختلف الأرقام مع بنية وأحجام نماذج مختلفة.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت