لماذا فجأة انفجر طلب SRAM؟ انظر إلى هذه العملية لتفهم الأمر.



بعد فترة قصيرة من إعلان أحد كبار مصنعي شرائح الذكاء الاصطناعي عن حيازته لمخزون شركة تكنولوجيا عملاقة، أعلن مباشرة عن استحواذه على شركة مبتكرة في مجال الشرائح. هل هذا حظ أم قوة؟ بالتدقيق ستعرف الإجابة.

ما هي الميزة الأساسية لهذه الشركة؟ على عكس معتمدية وحدات معالجة الرسوميات التقليدية (GPU) على الذاكرة الخارجية عالية النطاق الترددي (HBM)، تعتمد معالجات LPU الخاصة بهم على تصميم مدمج على الشريحة لذاكرة ثابتة كبيرة السعة (SRAM). هذه الذاكرة المدمجة على الشريحة بسعة 230MB توفر عرض نطاق ذاكرة يصل إلى 80TB/s — ما مفهوم هذا الرقم؟ سرعة معالجة البيانات تتفوق بشكل مباشر على الحلول التقليدية لوحدات معالجة الرسوميات.

كيف الأداء الفعلي؟ خدماتهم السحابية مشهورة بسرعة الاستنتاج المذهلة. عند تشغيل نماذج مفتوحة المصدر مثل Mixtral وLlama 2، يمكنها إخراج حوالي 500 رمز في الثانية، وهذا يفوق بشكل كبير سرعة استجابة الخدمات التقليدية. السعر أيضا تنافسي، حيث أن تكلفة الحساب على أساس مليون رمز معقولة جدًا.

لماذا هذا الأمر مهم الآن؟ لأن مجال الذكاء الاصطناعي يمر بتحول رئيسي — حيث ستتجاوز طلبات الاستنتاج بشكل كامل طلبات التدريب. في ظل هذا السياق، من خلال بنية معمارية مبتكرة مثل LPU، يمكن توفير بنية تحتية فعالة ومنخفضة التكلفة وقابلة للتوسع الحقيقي للاستنتاج، وهو ما يحتاجه السوق فعلاً. أكد مسؤول في شركة شرائح أن خطتهم هي دمج هذه المعالجات ذات الكمون المنخفض في بنية مصنع الذكاء الاصطناعي الخاص بهم، بهدف خدمة استنتاجات الذكاء الاصطناعي الأوسع نطاقًا والأعباء الزمنية الحية.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 5
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت