شيء مثير حدث في سوق استنتاج الذكاء الاصطناعي، ويستحق الحديث عنه. استحوذت NVIDIA على Groq، وعندما بدأ خوان رينسيوون في شرح منطق هذه الصفقة، أصبح واضحًا أن الأمر ليس مجرد صدفة.



قبل ذلك، كان التركيز كله على شيء واحد: كيف يمكن تمرير المزيد من البيانات في وقت واحد، أي على قدرة التحمل. لكن يتضح أن السوق انقسم. بعض المستخدمين مستعدون لدفع سعر أعلى للحصول على الإجابة بسرعة أكبر. أصبحت الرموز أغلى، وبدأ وقت التوليد لها يحمل قيمة حقيقية. هذا يغير اللعبة تمامًا.

إذن، تركز Groq تحديدًا على هذا — على الكمون المنخفض. بنيت معماريتهم LPU بحيث توفر تأخيرًا حتميًا ومتوقعًا. عندما استحوذت NVIDIA على Groq، قاموا في الأساس بملء فجوة في محفظتهم. تظل وحدات معالجة الرسومات NVIDIA ملوك القدرة على التحمل، لكن لقطاع الكمون المنخفض، هناك حاجة إلى معمارية مختلفة.

الرقاقة الجديدة Groq 3 LPU — هي أول منتج بعد الاندماج، مصنوع بتقنية 4 نانومتر. وفقًا لبيانات NVIDIA، كفاءته عند العمل مع نماذج كبيرة يتفوق بمقدار 35 مرة على أداء طرازهم الرائد Blackwell NVL72. هذا لا يتعلق بالسرعة المطلقة، بل بكمية القوة اللازمة لتحقيق تلك السرعة.

عمليًا، هذا يعني أنه يمكن الآن تقديم حلول مختلفة لاحتياجات مختلفة: إذا كنت تريد أقصى قدر من القدرة على التحمل — هناك وحدات معالجة الرسومات؛ إذا كنت بحاجة إلى استجابة سريعة بأي ثمن — هناك Groq. يمكن أن تكلف نفس النموذج بشكل مختلف اعتمادًا على مدى سرعة رغبتك في الحصول على النتيجة. هذا يوسع حدود ما يمكن تحسينه في سوق الاستنتاج.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت