بعد استحواذ نيفيديا بقيمة 20 مليار دولار على Groq، يتحدثون الآن عن الاستراتيجية: يجب أن يُقيم توكن الاستنتاج بناءً على الجودة، والتأخير المنخفض والسعر العالي للوحدة هما مسار جديد

robot
إنشاء الملخص قيد التقدم

أخبار ME، في 16 أبريل (بتوقيت UTC+8)، وفقًا لمراقبة Beating، شرح Jensen Huang لأول مرة بالتفصيل في مقابلة المنطق الاستراتيجي وراء استحواذ NVIDIA على شركة Groq. في ديسمبر من العام الماضي، استحوذت NVIDIA على قسم شرائح الاستنتاج في Groq مقابل 20 مليار دولار، وانضم مؤسس Groq، جوناثان روس، والفريق الأساسي إلى NVIDIA، واستمرت Groq في العمل كشركة مستقلة. في مارس من هذا العام، خلال مؤتمر GTC، أطلقت NVIDIA أول شريحة بعد الدمج، وهي Groq 3 LPU، المصنوعة بتقنية 4 نانومتر من سامسونج، وذكرت NVIDIA أن معدل استنتاجها لكل ميغاواط على نماذج تريليون المعاملات هو 35 ضعفًا لـ Blackwell NVL72. قال Jensen Huang إن الدافع وراء استحواذ Groq هو تدرج سوق الاستنتاج. سابقًا، كان تحسين الاستنتاج يتجه فقط نحو زيادة معدل المعالجة. لكن القيمة التجارية للرموز (tokens) ارتفعت بشكل كبير، وأصبح المستخدمون مستعدين لدفع أسعار مختلفة مقابل استجابة أسرع. «إذا استطعت أن أقدم للمبرمجين رموزًا ذات استجابة أسرع، مما يجعلهم أكثر كفاءة، فأنا على استعداد للدفع مقابل ذلك. لكن هذا السوق لم يظهر إلا مؤخرًا.» وصف ذلك بأنه توسع في حدود كفاءة سوق الاستنتاج: خارج الحلول ذات معدل المعالجة العالي الحالية، يتم إضافة قطاع سوق منخفض التأخير وعالي السعر. على نفس النموذج، يتم تحديد الأسعار بناءً على اختلاف زمن الاستجابة، «رغم أن معدل المعالجة أقل، إلا أن السعر يمكن أن يعوض ذلك». يُعرف بنية LPU في Groq بأنها ذات تأخير منخفض وموثوقية عالية، وتكمل مسار NVIDIA عالي معدل المعالجة، واستحواذ NVIDIA يعوض جزءًا مفقودًا في خط منتجات الاستنتاج. (المصدر: BlockBeats)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت