ارتفاع حاد في الطلب على قوة الحوسبة الاستدلالية - اسراع الشركات في السلسلة الصناعية لتسريع التوسع

صحيفة سوق الأوراق المالية الإلكترونية مراسلة وان جينرو

مع انتقال تقنية الذكاء الاصطناعي التوليدي من “تدريب النماذج” تدريجيًا نحو تطبيقات تجارية واسعة النطاق، يتحول استهلاك الحوسبة المرتبط بالتدريب بشكل تدريجي إلى طلب مستمر على الحوسبة يركز على الاستنتاج. في 17 مارس، قال المدير التنفيذي لشركة إنفيديا، هوان رونغشو، في مؤتمر GTC إن نقطة التحول في سوق استنتاج الذكاء الاصطناعي قد وصلت، حيث دخل الذكاء الاصطناعي مرحلة الاستنتاج والتنفيذ بشكل كامل، مع انفجار في طلبات الحوسبة للاستنتاج بشكل أسي.

“مع توسع نطاق تطبيقات الذكاء الاصطناعي التوليدي، قد يتجاوز معدل نمو طلبات الحوسبة للاستنتاج بشكل كبير معدل نمو حوسبة التدريب. من ناحية، يتفجر الطلب على التطبيقات، ويتسارع تطبيق الذكاء الاصطناعي التوليدي والأنظمة الذكية، مما يؤدي إلى تفاعلات عالية التردد من المستخدمين وطلبات استنتاج أسيّة؛ ومن ناحية أخرى، تواصل تقنيات مثل شرائح الاستنتاج المخصصة، والتبريد المائي، والاتصال الضوئي، تحقيق اختراقات، مما يعزز بشكل ملحوظ كفاءة الحوسبة والقدرة على المعالجة المتزامنة، مما يضع الأساس للنشر على نطاق واسع”، قال الباحث زانغ بنغيوان من شركة Shenzhen Qianhai PaiPaiNet لصحيفة “سوق الأوراق المالية”.

وفقًا لتوقعات المؤسسات الصناعية، فإن أهمية حوسبة الاستنتاج تتزايد باستمرار. تتوقع شركة البيانات الدولية (IDC) أنه بحلول عام 2027، ستتجاوز نسبة حوسبة الاستنتاج في الصين 70% من إجمالي الحوسبة. قال مؤسس والرئيس التنفيذي لمجموعة IDC China، هوان تشاو، إن عام 2026 سيشهد دخول الذكاء الاصطناعي الصناعي مرحلة ازدهار متعددة، حيث يتحول تطبيق الحوسبة من “التركيز على التدريب” إلى “التركيز على الاستنتاج”، مع اقتراب دورة انفجار طلبات الحوسبة للاستنتاج بشكل كامل.

لمواجهة النمو السريع في طلبات الحوسبة للاستنتاج، تسرع الشركات في سلسلة الصناعة المحلية من تطوير التكنولوجيا وتخطيط المنتجات. على مستوى الشرائح، تطلق العديد من الشركات شرائح محسنة خصيصًا لمهام الاستنتاج. بالمقارنة مع شرائح التدريب التقليدية، تركز شرائح الاستنتاج بشكل أكبر على التحكم في استهلاك الطاقة، والكفاءة من حيث التكلفة، ومرونة النشر، مما يفتح آفاقًا واسعة للتطبيقات على السحابة وعلى الحافة.

على سبيل المثال، شركة Shenzhen CloudTian Lifi Technology Co., Ltd. (المعروفة بـ"CloudTian Lifi")، التي تعتمد على وحدة معالجة الأعصاب (NPU)، حددت مسار تقنية GPNPU على شرائح الحوسبة الكبيرة لمهام الاستنتاج في السحابة، وقامت بتحسين عميق في وحدات المصفوفة، والمتجهات، ومستويات التخزين، واستخدام النطاق الترددي الفعال، بهدف خفض تكلفة الرموز بشكل أسي، وتسريع تطبيق النماذج الكبيرة على نطاق واسع وشمولية.

بحلول عام 2025، حققت CloudTian Lifi إيرادات قدرها 1.308 مليار يوان، بزيادة قدرها 42.57%. قال مسؤول في الشركة لصحيفة “سوق الأوراق المالية”: “بالنسبة للشركات، مع تحول المنافسة في الصناعة من حجم التدريب إلى كفاءة الاستنتاج، وتكلفة التسليم، وربحية النظام، فإن من يستطيع تنسيق الأجهزة، والتخزين، والبرمجيات بشكل مبكر سيكون لديه فرصة أكبر لاحتلال موقع قيادي في عصر الاستنتاج.”

على مستوى الخوادم والأنظمة، يواصل كبار المصنعين إطلاق منصات حوسبة محسنة لمهام الاستنتاج. على سبيل المثال، أطلقت شركة Inspur Electronics Information Industry Co., Ltd. خادم الاستنتاج YuanNao R1، الذي يدعم تشغيل 16 بطاقة PCIe مزدوجة العرض، ويمكنه نشر نموذج DeepSeek-671B على جهاز واحد؛ وأطلقت خادم استنتاج CPU YuanNao، الذي يتيح نشر وتشغيل نماذج استنتاج من الجيل الجديد مثل DeepSeek-R132B وQwQ-32B بكفاءة عالية.

وفي الوقت نفسه، تتسارع أيضًا بنية تحتية الحوسبة. في الماضي، كانت العديد من مراكز الحوسبة الذكية في الصين تعتمد على نمط بناء متكامل للتدريب والاستنتاج. في 12 مارس، فازت شركة CloudTian Lifi بمشروع دعم البنية التحتية لإنتاجية جديدة من خلال الذكاء الاصطناعي في مدينة زهانجيانغ بمقاطعة قوانغدونغ، والذي يركز على تجمعات استنتاج الذكاء الاصطناعي المخصصة لمهام الاستنتاج، ويهدف إلى تقديم نماذج تطبيقية متنوعة للصناعة التقليدية المحلية.

يعتقد هولي، المدير العام لشركة Beijing Zhi Yu Zhi Shan Investment Management Co., Ltd، أن في هذا التحول، ستستفيد شرائح الاستنتاج عالية الأداء، وذاكرة HBM، والبرمجيات الكاملة من عوائد الحوسبة بشكل أسرع. تتطلب سيناريوهات الاستنتاج زمن استجابة منخفض، وسرعة نقل عالية، وكفاءة في استهلاك الطاقة بشكل كبير، حيث ستعمل بنية LPU وASIC المخصصة على تسريع استبدال وحدات الحوسبة العامة، وستكون تقنيات التخزين مثل HBM4 حاسمة في تجاوز عنق الزجاجة في عرض النطاق الترددي. بالإضافة إلى ذلك، تتجه الحوسبة من مراكز البيانات إلى الحافة، مع زيادة الطلب على رفوف الاستنتاج عالية الكثافة وتقنيات التبريد المتقدمة، ومع تطبيق تقنيات التكميم، وضغط المعلمات، والتحسينات البرمجية، ستدفع الصناعة من التكديس المادي إلى التنسيق بين الأجهزة والبرمجيات.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.33Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.33Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.35Kعدد الحائزين:2
    0.00%
  • القيمة السوقية:$2.33Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.32Kعدد الحائزين:1
    0.00%
  • تثبيت