ارتفاع حاد في الطلب على قوة الحوسبة الاستدلالية - اسراع الشركات في السلسلة الصناعية لتسريع التوسع

robot
إنشاء الملخص قيد التقدم

وكالة أنباء الأوراق المالية والصحف الاقتصادية، الصحفي وان جينرو

مع انتقال تقنية الذكاء الاصطناعي التوليدي من “تدريب النماذج” تدريجيًا نحو التطبيق التجاري على نطاق واسع، يتحول استهلاك الحوسبة المرتبط بالتدريب بشكل تدريجي إلى طلب مستمر على الحوسبة يركز على الاستنتاج. في 17 مارس، قال يوجين نوا، الرئيس التنفيذي لشركة إنفيديا، في مؤتمر GTC إن نقطة التحول في سوق استنتاج الذكاء الاصطناعي قد وصلت، حيث دخل الذكاء الاصطناعي مرحلة الاستنتاج والتنفيذ بشكل كامل، مع انفجار في طلبات الحوسبة للاستنتاج بشكل أسي.

“مع توسع نطاق تطبيقات الذكاء الاصطناعي التوليدي، قد يتجاوز معدل نمو طلبات الحوسبة للاستنتاج بكثير تلك الخاصة بالتدريب. من ناحية، يتفجر الطلب على التطبيقات، ويتسارع تطبيق الذكاء الاصطناعي التوليدي والوكيل الذكي، مما يؤدي إلى طلبات استنتاج عالية التردد من قبل المستخدمين؛ ومن ناحية أخرى، تواصل تقنيات مثل شرائح الاستنتاج المخصصة، والتبريد المائي، والاتصال الضوئي، تحقيق اختراقات، مما يعزز بشكل كبير كفاءة الحوسبة والقدرة على التزامن، مما يضع أساسًا للنشر على نطاق واسع”، قال الباحث تشانغ بنيوان من شركة Shenzhen Qianhai PaiPaiNet لصحيفة “سيركيتيز ديلي”.

وفقًا لتوقعات المؤسسات الصناعية، فإن أهمية الحوسبة للاستنتاج تتزايد باستمرار. تتوقع شركة البيانات الدولية (IDC) أنه بحلول عام 2027، ستتجاوز نسبة الحوسبة للاستنتاج في الصين 70% من إجمالي الحوسبة. قال هوانغ تشاو، مؤسس والرئيس التنفيذي لمجموعة IDC China، إن عام 2026 سيشهد دخول الذكاء الاصطناعي الصناعي في مرحلة ازدهار متعددة، حيث يتحول تطبيق الحوسبة من “التركيز على التدريب” إلى “التركيز على الاستنتاج”، مع اقتراب دورة انفجار طلبات الحوسبة للاستنتاج بشكل كامل.

لمواجهة النمو السريع في طلبات الحوسبة للاستنتاج، تسرع الشركات في سلسلة الصناعة المحلية من تطوير التكنولوجيا وتخطيط المنتجات. على مستوى الشرائح، تطلق العديد من الشركات شرائح محسنة لمهام الاستنتاج. بالمقارنة مع شرائح التدريب التقليدية، تركز شرائح الاستنتاج بشكل أكبر على التحكم في استهلاك الطاقة، والكفاءة من حيث التكلفة، ومرونة النشر، مما يفتح آفاقًا واسعة للتطبيقات على السحابة وعلى الحافة.

على سبيل المثال، شركة Shenzhen Yuntian Lifei Technology Co., Ltd. (المعروفة بـ"Yuntian Lifei")، التي تعتمد على وحدة المعالجة العصبية (NPU)، حددت مسار تقنية GPNPU على شرائح الحوسبة الكبيرة لمهام الاستنتاج في سيناريوهات السحابة، وقامت بتحسين عميق في وحدات المصفوفة، والوحدات الاتجاهية، ومستويات التخزين، واستخدام عرض النطاق الترددي الفعال، بهدف خفض تكلفة الرموز بشكل أسي، وتسريع تطبيق النماذج الكبيرة بشكل واسع وشامل.

بحلول عام 2025، حققت Yuntian Lifei إيرادات قدرها 1.308 مليار يوان، بزيادة قدرها 42.57%. قال مسؤول ذو صلة بالشركة لصحيفة “سيركيتيز ديلي”: “بالنسبة للشركات، مع تحول المنافسة في الصناعة من حجم التدريب إلى كفاءة الاستنتاج، وتكلفة التسليم، وقدرة النظام على تحقيق الأرباح، فإن من يستطيع تنسيق الأجهزة، والتخزين، والبرمجيات بشكل مبكر، سيكون لديه فرصة أكبر لفرض السيطرة في عصر الاستنتاج.”

على مستوى الخوادم والأنظمة، يواصل كبار المصنعين إطلاق منصات حوسبة محسنة لمهام الاستنتاج. على سبيل المثال، أطلقت شركة Inspur Electronics Information Industry Co., Ltd. خادم الاستنتاج YuanNao R1، الذي يدعم تشغيل 16 بطاقة PCIe مزدوجة العرض، ويمكنه نشر نموذج DeepSeek-671B على جهاز واحد؛ وأطلقت خادم استنتاج CPU YuanNao، الذي يتيح نشر وتشغيل نماذج استنتاج من الجيل الجديد مثل DeepSeek-R132B وQwQ-32B بكفاءة عالية.

وفي الوقت نفسه، تتسارع أيضًا بنية تحتية الحوسبة. في الماضي، كانت العديد من مراكز الحوسبة الذكية في الصين تعتمد على نمط بناء متكامل للتدريب والاستنتاج. في 12 مارس، فازت شركة Yuntian Lifei بمشروع دعم البنية التحتية لإنتاجية جديدة من خلال الذكاء الاصطناعي في مدينة زهانجيانغ بمقاطعة قوانغدونغ، والذي يركز على تجمعات استنتاج الذكاء الاصطناعي المخصصة لمهام الاستنتاج، ويهدف إلى تطبيقات صناعية متنوعة، وتقديم نماذج عملية للتحول الرقمي للصناعات التقليدية المحلية.

يعتقد هولي، المدير العام لشركة Beijing Zhi Yu Zhi Shan Investment Management Co., Ltd، أن في هذا التحول، ستستفيد شرائح الاستنتاج عالية الأداء، وذاكرة HBM، والبرمجيات الكاملة من فوائد الحوسبة بشكل أسرع. تتطلب سيناريوهات الاستنتاج استجابة منخفضة للكمون، وعالية في معدل النقل، وكفاءة عالية في استهلاك الطاقة، حيث ستعمل بنية LPU وASIC المخصصة على تسريع استبدال وحدات الحوسبة العامة، وستكون تقنيات التخزين مثل HBM4 حاسمة في تجاوز عنق الزجاجة في عرض النطاق الترددي. بالإضافة إلى ذلك، تتجه الحوسبة من مراكز البيانات إلى الحافة، مع زيادة الطلب على رفوف الاستنتاج عالية الكثافة وتقنيات التبريد المتقدمة، ومع تحسينات الترجمة مثل التكميم، وضغط المعلمات، ستدفع الصناعة من التكديس المادي إلى التنسيق بين البرمجيات والأجهزة.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.33Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.31Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.39Kعدد الحائزين:2
    0.58%
  • القيمة السوقية:$2.32Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.31Kعدد الحائزين:1
    0.00%
  • تثبيت