هل جاء عصر الاستنتاج بالذكاء الاصطناعي حقًا؟ إعادة تشكيل القوة الحاسوبية الثلاثية بين وحدات معالجة الرسومات، ووحدات المعالجة المركزية، ودوائر ASIC

في 22 يونيو 2026، شهد قطاع الشرائح في السوق الأمريكية ارتفاعًا كبيرًا—ارتفع مؤشر أشباه الموصلات في فيلادلفيا بنسبة 6.42% خلال يوم واحد، وارتفعت أسهم إنتل بأكثر من 10% بسبب أنباء عن تعاونها مع آبل في إنتاج الشرائح، وارتفعت أسهم شركة تايوان للصناعات الدقيقة (TSMC) بأكثر من 6.94% لتغلق عند 462.12 دولار، وارتفعت شركة نيفيديا بنحو 3%. وراء مشاعر السوق، يكمن حكم صناعي يتسارع في التحقق: لقد تغيرت بنية الطلب على قدرات الذكاء الاصطناعي من الاعتماد على التدريب إلى الاعتماد على الاستنتاج.

وفقًا لتحليلات الصناعة، فإن نسبة الطلب على الاستنتاج من إجمالي قدرات الذكاء الاصطناعي ارتفعت من حوالي الثلث في عام 2023 إلى ثلثيها في 2026، ومن المتوقع أن تصل إلى 70% إلى 85% بين عامي 2028 و2030. هذا التحول الهيكلي يعيد تحديد ساحة المنافسة الرئيسية في صناعة الشرائح—من "من لديه أسرع GPU في التدريب" إلى "من لديه أقل تكلفة استنتاج إجمالية وأعلى قدرة معالجة".

سوق شرائح الذكاء الاصطناعي للاستنتاج العالمي بقيمة 85.4 مليار دولار في 2024، ومن المتوقع أن ينمو من 105.47 مليار دولار في 2025 إلى 570.77 مليار دولار في 2033، بمعدل نمو سنوي مركب قدره 23.5% خلال فترة التوقعات. من بين ذلك، يُقدر أن سوق شرائح الذكاء الاصطناعي السحابية للاستنتاج في 2025 بقيمة 102.19 مليار دولار، ومن المتوقع أن يرتفع إلى 118.9 مليار دولار في 2026، وإلى 320.98 مليار دولار بحلول 2032. في الوقت نفسه، من المتوقع أن يتوسع سوق مجموعات شرائح الذكاء الاصطناعي على الحافة (الاستنتاج والتدريب معًا) من 34.4 مليار دولار في 2026 إلى 96 مليار دولار في 2031.

خلال دورة التوسع هذه، تتغير القوة بين أنواع الشرائح بشكل دقيق وعميق. لا تزال وحدات معالجة الرسومات (GPU) أكبر لاعب في السوق، وتحت دعم الطلب المزدوج على التدريب والاستنتاج، من المتوقع أن تحافظ على معدل نمو سنوي مركب قدره 20% حتى 2031. لكن شرائح ASIC للذكاء الاصطناعي تعتبر من قبل العديد من المؤسسات أسرع القطاعات نموًا. يقدر محللو جي بي مورغان أن سوق شرائح ASIC الرقمية للذكاء الاصطناعي ستصل إلى حوالي 60-70 مليار دولار بحلول 2026، مع استمرار معدل النمو المركب لأكثر من 40-50% خلال السنوات القليلة القادمة.

الأهم من ذلك، هو عودة المعالجات المركزية (CPU). على مدى السنوات الثلاث الماضية، كانت المعالجات المركزية في هامش حديث الذكاء الاصطناعي على المدى الطويل، لكن انفجار طلب الاستنتاج بدأ يغير هذا المشهد.

لماذا تعود المعالجات المركزية إلى مركز الساحة

الاختلافات الجوهرية بين استنتاج وتدريب الذكاء الاصطناعي من حيث المنطق الحسابي. التدريب هو عملية حسابية ضخمة ومتوازية لمصفوفات—مليارات من العمليات العائمة يمكن أن تتم في عشرات الآلاف من نوى GPU في وقت واحد، وهو المجال الذي تتفوق فيه GPU بشكل مطلق. لكن الاستنتاج، خاصة في الذكاء الاصطناعي الوكيل (Agentic AI)، يتطلب تنسيق المهام، استدعاء الأدوات، الحكم المنطقي متعدد الخطوات واتخاذ القرارات التسلسلية. هذه الأحمال ليست حسابات متوازية بحتة، بل تعتمد بشكل كبير على التحكم المنطقي المعقد والقدرة على المعالجة التسلسلية التي تتفوق فيها المعالجات المركزية.

أشارت دراسة مشتركة بين جامعة جورجيا للتكنولوجيا وشركة إنتل إلى أن 50% إلى 90% من التأخير في سيناريوهات الذكاء الاصطناعي الوكيل يأتي من المعالجات المركزية، وليس من شرائح الحوسبة—لأن النماذج الكبيرة تتطلب استدعاء الإضافات، البحث عبر الإنترنت، ومعالجة منطق متعدد الخطوات، وكل ذلك يعتمد على جدولة المعالج المركزي. وأقرت نيفيديا بنفسها في مارس 2026 بهذا الواقع: حيث صرح مسؤولها ديون هاريس علنًا أن "المعالج المركزي أصبح عنق الزجاجة في تدفقات عمل الذكاء الاصطناعي"—وهو تصريح من شركة تؤمن بأن "GPU هو الشريحة الوحيدة التي يحتاجها الذكاء الاصطناعي".

يمكن ملاحظة هذا الاتجاه بشكل أكثر وضوحًا من خلال تغير نسب التكوين. في مرحلة تدريب الذكاء الاصطناعي، عادةً ما تكون نسبة التكوين بين المعالجات المركزية وGPU تصل إلى 1:8، حيث تتحمل GPU الجزء الأكبر من الحمل الحسابي. لكن مع دخول عصر الاستنتاج، وفقًا لتقرير TrendForce، تتقارب هذه النسبة بسرعة إلى ما بين 1:1 و1:2. وأشار الرئيس التنفيذي لشركة إنتل، تشن لي و، في مؤتمر أرباح الربع الأول من 2026، إلى أن عبء التدريب يتطلب عادة 7 إلى 8 وحدات GPU مقابل معالج مركزي واحد، بينما عبء الاستنتاج أصبح يتطلب 3 إلى 4 وحدات GPU مقابل معالج مركزي واحد، مع توقعات بالمزيد من التوازن في المستقبل ليصل إلى 1:1.

بالنسبة لتقديرات الرئيس التنفيذي لنيفيديا، هوانغ رنغ سين، فإن كل مركز بيانات بقدرة 1 جيجاوات يحتاج إلى حوالي 300 ألف وحدة من معالجات Rubin GPU، ومع حساب أن كل معالج ARM يحتوي على 136 نواة، فإن كل مركز بيانات بقدرة 1 جيجاوات يحتاج إلى حوالي 221 ألف معالج مركزي، مما يرفع نسبة التكوين الجديدة إلى حوالي 1:1.4 بين المعالجات المركزية وGPU. مقارنةً بنسبة الهيمنة السابقة لـGPU، فإن مكانة المعالجات المركزية قد ارتفعت بشكل كبير.

الحصن المنيع لـGPU وتحديات سيناريوهات الاستنتاج

على الرغم من أن المعالجات المركزية تتعافى، إلا أن GPU لا تزال تحتفظ بمكانتها الحاسمة في مرحلة استنتاج الذكاء الاصطناعي، ويرتكز ذلك على عرض النطاق الترددي للذاكرة وقدرة المعالجة المتوازية.

خلال استنتاج نماذج اللغة الكبيرة (LLM)، يتطلب توليد كل رمز قراءة مئات الملايين إلى مئات المليارات من المعلمات، وهو مهمة تعتمد بشكل رئيسي على كثافة الذاكرة. تعتمد الحلول المعتمدة على المعالجات المركزية على ذاكرة DDR النظام، مع عرض نطاق ترددي عادة بين 50 و100 جيجابايت/ثانية؛ بينما تستخدم وحدات معالجة الرسوميات GDDR6X أو HBM، مع عرض نطاق ترددي يتجاوز 800 جيجابايت/ثانية، ويمكن أن تصل إلى 1.5 تيرابايت/ثانية في أعلى النماذج، وهو ما يعادل 20 ضعفًا للذاكرة على المعالج المركزي. في استنتاج نموذج Llama 3.1 8B، يكون سرعة الحل المعتمد على المعالج المركزي فقط 819 رمز/ثانية، بينما يمكن لمجموعة من 8 وحدات GPU أن تصل إلى 46,841 رمز/ثانية. وعند زيادة الطلبات المتزامنة، ينخفض أداء المعالج المركزي من 819 رمز/ثانية إلى 257 رمز/ثانية، بينما تظل مجموعة 8 وحدات GPU تقريبًا ثابتة دون تدهور.

من حيث كثافة الحوسبة، فإن GPU تستخدم آلاف النوى CUDA لتحقيق التوازي، وتدعم تنسيقات منخفضة الدقة مثل FP4/FP8، مع قدرة حسابية تصل إلى مئات تيرافلوبس، بينما عادةً ما تكون قدرة المعالج المركزي على FP32 بين 1 و10 تيرافلوبس.

هذه البيانات توضح أنه في سيناريوهات الاستنتاج التي تتطلب قدرة عالية على المعالجة المتزامنة، مثل خدمات الذكاء الاصطناعي السحابية ذات الحجم الكبير، لا تزال GPU الخيار الأمثل. ولا تزال مكانة نيفيديا في هذا المجال غير مهددة. وفقًا لبيانات SemiAnalysis، فإن حصة نيفيديا في سوق شرائح التدريب على الذكاء الاصطناعي في الربع الأول من 2026 تبلغ 92%، وحصة شرائح الاستنتاج 78%. وتقدر IDC أن نيفيديا تسيطر على حوالي 81% من سوق شرائح الذكاء الاصطناعي. ومن المتوقع أن تصل قيمة سوق المسرعات للذكاء الاصطناعي إلى حوالي 160 مليار دولار في 2025، وأن تتجاوز 200 مليار دولار في 2026، مع أنفاق على الاستنتاج تمثل ثلثيها تقريبًا.

لكن، من المهم ملاحظة أن حصة GPU في سيناريوهات الاستنتاج تواجه ضغوطًا متعددة—من عودة المعالجات المركزية، والمنافسة من ASIC المخصصة، والاعتبارات الاقتصادية.

هجوم شركات المعالجات المركزية على سوق الاستنتاج

إعادة تقييم قيمة المعالجات المركزية في مرحلة الاستنتاج، تحولت إلى قوة سوقية قابلة للقياس.

سوق معالجات مراكز البيانات ينمو بسرعة مدفوعًا بزيادة الطلب على أعباء العمل في الذكاء الاصطناعي التوليدي، ومن المتوقع أن يتوسع من 215 مليار دولار في 2025 إلى 656 مليار دولار في 2031. أشارت شركة Guohai Securities إلى أن مراكز البيانات الضخمة دخلت "دورة ترقية"، مع توقع أن يزيد شحن معالجات الخوادم بنسبة 25% في 2026.

تستفيد شركة AMD بشكل ملحوظ من هذا الاتجاه. الطلب على خوادم الذكاء الاصطناعي زاد من مبيعات معالجات EPYC، واحتلت الجيل الخامس من معالجات تورين حصة كبيرة في سوق معالجات الخوادم، مع توقع نمو بنسبة 50% على الأقل في 2026. يتوقع محللو Bernstein أن مبيعات معالجات EPYC الرائدة ستقفز بنسبة 30% في 2026. في سوق معالجات مراكز البيانات، بحلول بداية 2026، كانت إنتل تسيطر على حوالي 60% من الحصة السوقية، وAMD حوالي 24%، ونيفيديا حوالي 6%. وتنافس AMD أيضًا في سوق معالجات GPU للاستنتاج من خلال معالجات Instinct، مما يمنحها موقعًا فريدًا في استراتيجيتها المزدوجة في عصر الاستنتاج.

إنتل أيضًا تتخذ خطوات نشطة لتعديل استراتيجيتها. في يونيو 2026، خلال مؤتمر Computex، أعلن الرئيس التنفيذي الجديد، تشن لي و، باستخدام تقنية 18A ومعمارية تفصل بين الخوادم، أن المعالجات المركزية ستعود إلى المركز في عصر الاستنتاج، وأن البنية التحتية للذكاء الاصطناعي ستتحول من "شراء حزمة كاملة" إلى "تجميع ليغو". تقنية AMX المدمجة في معالجات Xeon يمكن أن توفر تسريعًا للاستنتاج لنماذج اللغة الكبيرة ذات المعلمات المتوسطة والصغيرة، دون الحاجة إلى تركيب GPU أو معالجات تسريع أخرى.

أما الرمزية الأكبر فهي من شركة نيفيديا نفسها. هذه الشركة التي عرفت عصر الذكاء الاصطناعي من خلال GPU، أطلقت في 2026 خطي منتجات CPU هما Grace وVera، حيث تم تصميم Vera خصيصًا لأعباء عمل الاستنتاج والذكاء الاصطناعي الوكيل. تتوقع نيفيديا أن تصل إيرادات أعمال المعالجات المركزية إلى 20 مليار دولار في 2026. وأطلقت نيفيديا مع شركة Arm منتجات CPU مستقلة في 2026، مما يدل على دخولها رسميًا في سباق المعالجات المركزية.

الصعود المتزايد لـASIC والشرائح المخصصة: مسار ثالث

بعيدًا عن السرد الثنائي بين GPU وCPU، فإن ASIC (الدوائر المتكاملة المخصصة) أصبح المتغير الأسرع نموًا في سوق الاستنتاج.

توقع شركة TD Cowen أن حصة المسرعات التجارية ستنخفض من حوالي 91% في 2025 إلى حوالي 75% في 2030، بينما سترتفع حصة ASIC المخصصة من حوالي 9% إلى حوالي 25%. من المتوقع أن ينمو شحن خوادم ASIC بنسبة 44.6% في 2026، مقابل نمو بنسبة 16.1% في خوادم GPU، وهو أقل بثلاثة أضعاف.

تسارع الشركات الكبرى في السحابة من تطوير شرائح استنتاج خاصة بها. تظهر شرائح ASIC مثل TPU من جوجل، Inferentia من AWS، MTIA من Meta، وLPU (وحدة معالجة اللغة) من Groq، والتي تم تصميمها خصيصًا لتحسين الاستنتاج، بشكل متزايد. حققت Broadcom في الربع الثاني من 2026 إيرادات ذكاء اصطناعي بلغت 10.8 مليار دولار، بزيادة 143%، وتوقعاتها السنوية تصل إلى 56 مليار دولار، بزيادة 180%. وتتوقع Broadcom أن تسيطر على حوالي 60% من سوق شرائح الذكاء الاصطناعي المخصصة.

هذا الاتجاه يشير إلى أن سوق شرائح الاستنتاج يتجه من "سيطرة GPU العامة" إلى "نظام متعدد من GPU + CPU + ASIC". حيث تتولى GPU التدريب المكثف والاستنتاج الكبير، وتقوم المعالجات المركزية بتنظيم المهام والتحكم في النظام، وتحقق ASIC الكفاءة القصوى في استهلاك الطاقة عند أعباء الاستنتاج الخاصة.

هيكل التكاليف وإعادة تشكيل اقتصاديات الاستنتاج

اختيار شرائح الاستنتاج يعتمد في النهاية على مسألة أساسية: تكلفة كل مليون رمز استنتاج.

في مرحلة التدريب، تكون دقة النموذج ومدة التدريب هي المعايير الأساسية، وتكون التكاليف أكثر مرونة. لكن الاستنتاج هو نشاط مستمر ومتكرر—كل استدعاء API، وكل طلب من المستخدم يفرض تكلفة مباشرة. هذا يحول المنافسة على شرائح الاستنتاج من "الأداء المطلق" إلى "الإنتاجية الفعالة لكل وحدة تكلفة".

الحلول المعتمدة على GPU تتطلب استثمارًا أعلى في الأجهزة. على سبيل المثال، سعر AMD MI300X يتراوح بين 10,000 و15,000 دولار، بينما سعر NVIDIA H100 يتراوح بين 25,000 و40,000 دولار. لكن تكلفة الوحدة من القدرة الحسابية أقل على GPU—فمثلاً، وفقًا لمثال من مزود خدمة سحابي، فإن تكلفة توليد رمز واحد في الثانية باستخدام GPU أقل بنسبة 40-60% من تكلفة المعالج المركزي. الحلول المعتمدة على المعالج المركزي تتميز بعدم الحاجة إلى استثمار إضافي في الأجهزة، وتناسب سيناريوهات الأحمال الأحادية ذات الطلب المنخفض والانتظار المنخفض.

لكن مع توسع حجم الاستنتاج، تزداد التكاليف الحدية للمعالجات المركزية بشكل أسرع—عندما يزداد الطلب المتزامن، تحتاج المعالجات المركزية إلى جدولة المهام عبر الزمن، وتزداد تكاليف تبديل السياقات بشكل أسي مع زيادة التوازي. هذا يعني أن النشر الموسع للاستنتاج على GPU أو ASIC غالبًا ما يحقق عائد استثمار طويل الأمد أعلى من خلال زيادة الإنتاجية وتقليل التكلفة لكل وحدة.

الخاتمة

ارتفع نسبة الطلب على قدرات الاستنتاج من الثلث إلى الثلثين، والخلفية وراء هذا التغير في الأرقام هو تحول عميق في منطق المنافسة في صناعة الشرائح.

بالنسبة لنيفيديا، فإن هيمنتها المطلقة على سوق التدريب (حوالي 90% من الحصة) من غير المرجح أن تتغير على المدى القصير، لكن المنافسة على سوق الاستنتاج ستكون أكثر حدة. قدمت شركة New Street Research توقعات أكثر تطرفًا: أن تنخفض حصة نيفيديا في الاستنتاج إلى 20-30% بحلول 2028. وحتى مع التوقعات الأكثر تحفظًا من Bloomberg Intelligence، التي تتوقع أن تحافظ نيفيديا على 70-75% من الحصة بحلول 2030، فإن حقيقة أن شحنات ASIC تتزايد بسرعة تفوق GPU أصبحت واضحة.

أما بالنسبة لـAMD وإنتل، فإن عودة الطلب على المعالجات المركزية في عصر الاستنتاج تمثل فرصة هيكلية. تستخدم AMD استراتيجيتها المزدوجة عبر معالجات EPYC وGPU من نوع Instinct، بينما تواصل إنتل تحديث معالجاتها باستخدام تقنية 18A ومعمارية Xeon، في محاولة لاقتناص هذه الفرصة.

بالنسبة لمزودي الحوسبة السحابية ومطوري تطبيقات الذكاء الاصطناعي، فإن تنويع خيارات الشرائح يعني مساحة أكبر لتحسين التكاليف بشكل أكثر دقة. من GPU العام إلى ASIC المخصص، ومن استنتاج المعالجات المركزية إلى تسريع GPU، ستعتمد الاختيارات بشكل متزايد على خصائص الأحمال—حجم النموذج، متطلبات التأخير، التوازي، والميزانية.

تتسارع احتياجات قدرات الاستنتاج بشكل يفوق سرعة التدريب. هذا التحول في مركز الثقل من التدريب إلى الاستنتاج يعيد تشكيل سلسلة الصناعة بأكملها، من تصميم الشرائح إلى بنية مراكز البيانات. لن تفقد GPU مكانتها، لكنها لن تكون الحل الوحيد بعد الآن.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت