هل فهمت هذه الاستراتيجية المثيرة للاهتمام من NVIDIA؟ لقد استحوذوا على أعمال شرائح الاستدلال من Groq مقابل 200 مليار دولار، والآن بدأ الأمر يصبح أكثر وضوحًا لماذا فعلوا ذلك.



ما لفت انتباهي هو شرح Huang Renxun حول المنطق وراء هذا الاستحواذ. بشكل أساسي، سوق الاستدلال يتقسم. سابقًا، كان الجميع يركز على شيء واحد فقط: زيادة معدل المعالجة. لكن بعد ذلك، تغيرت القيمة التجارية للرموز بشكل كبير، ويستعد مستخدمون مختلفون لدفع أسعار مختلفة اعتمادًا على سرعة الاستجابة.

إنه شيء كالتالي: إذا استطعت تقديم إجابات أسرع للمهندسين، مما يسمح لهم بالعمل بكفاءة أكبر، فسيكونون على استعداد لدفع المزيد مقابل ذلك. وهذا الطلب على انخفاض الكمون هو أمر جديد نسبيًا في السوق.

هنا تدخل Groq. معمارية LPU الخاصة بهم معروفة تحديدًا بكونها ذات زمن استجابة منخفض حتمي، مما يكمل بشكل مثالي نهج زيادة معدل المعالجة الخاص بوحدات معالجة الرسوميات من NVIDIA. عندما أطلقوا Groq 3 LPU بتقنية 4 نانومتر، أظهروا أن قدرة الاستدلال لكل واط في نماذج تحتوي على تريليونات من المعلمات تفوق Blackwell NVL72 بمقدار 35 مرة. وهذا ليس بالقليل.

أي أن NVIDIA سدّت فجوة مهمة في خط منتجاتها. الآن، تغطي كل من قطاع زيادة معدل المعالجة وقطاع انخفاض الكمون والقيمة العالية لكل وحدة. توسع باريتو، كما يسميه البعض. نفس النموذج، بأسعار مختلفة حسب زمن الاستجابة. معدل معالجة أقل، لكن السعر لكل وحدة يعوض ذلك.

هذه هي الاستراتيجية: ليست منافسة، بل تكامل. ويبدو أن الأمر منطقي جدًا بالنظر إلى كيف يتطور سوق الذكاء الاصطناعي.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت