لماذا لا يمكن لمراكز بيانات الذكاء الاصطناعي الاعتماد فقط على GPU؟ تحليل آلية التنسيق بين الذاكرة والشبكة والتخزين.

جدار الذاكرة: أول عنق زجاجة في عصر النماذج الكبيرة

شهدت أحجام معلمات النماذج الكبيرة للذكاء الاصطناعي نموًا هائلاً خلال العامين الماضيين. بين عامي 2024 و2026، زاد عدد معلمات النماذج الكبيرة السائدة بمئة ضعف، وتوسع حجم نافذة السياق من آلاف الكلمات إلى ملايين الكلمات. ومع ذلك، لم يتجاوز متوسط الزيادة السنوية في عرض النطاق الترددي لذاكرة الخادم 15%، وهو متأخر كثيرًا عن معدل نمو أعمال الذكاء الاصطناعي. هذا التفاوت الكبير في سرعة تحديث البرامج والأجهزة يجعل "جدار الذاكرة" العائق الأساسي أمام إطلاق قوة الحوسبة للذكاء الاصطناعي.

ما يسمى بجدار الذاكرة هو في جوهره أن سرعة تحسين أداء وحدات المعالجة المركزية (CPU) ووحدات معالجة الرسوميات (GPU) تفوق بكثير سرعة تحسين عرض النطاق الترددي لقراءة وكتابة الذاكرة وتقليل زمن الوصول. تعمل شرائح الحوسبة بسرعة فائقة، لكن الوصول إلى البيانات لا يواكب هذه السرعة، مما يؤدي إلى بقاء المعالج في حالة خمول وانتظار لفترة طويلة. وفقًا لتقارير الاختبارات الصناعية، يمكن أن تصل نسبة وقت الخمول لوحدات GPU الناتج عن عنق زجاجة الإدخال/الإخراج (I/O) للبيانات في مجموعات تضم عشرة آلاف بطاقة GPU إلى أكثر من 40% - مما يعني أن ما يقرب من نصف وقت شرائح الحوسبة باهظة الثمن يُهدر في انتظار نقل البيانات.

ندرة موارد الذاكرة مذهلة بنفس القدر. يستهلك خادم استدلال واحد للذكاء الاصطناعي من ذاكرة DRAM وHBM أكثر بعشر مرات من خادم مركز البيانات التقليدي، وقد استحوذت مجموعات الذكاء الاصطناعي على ما يقرب من 60% من إنتاج رقائق DRAM على مستوى العالم. كما أن ذاكرة HBM تعاني من نقص الطلبات المغلقة منذ فترة طويلة، حيث تم حجز الإنتاج الرئيسي من قبل العملاء الكبار مسبقًا حتى عامي 2026 أو حتى 2027. تشير شركة Gartner إلى أن الطلب القوي إلى جانب عنق الزجاجة في الإمدادات دفع أسعار HBM إلى مستويات قياسية جديدة، مما جعل الذاكرة مجالًا عالي الربح في نظر مصنعي أشباه الموصلات.

لكسر جدار الذاكرة، يتقدم القطاع على مسارين: الأول هو تحسين الجدولة والضغط على مستوى البرمجيات، من خلال تقنيات مثل الجدولة الهرمية لذاكرة التخزين المؤقت (KV cache) والتحويل الكمي منخفض البت لتفعيل موارد التخزين الحالية؛ والثاني هو إعادة هيكلة الأجهزة، بما في ذلك تحديثات HBM وتطبيق بروتوكولات الربط البيني الجديدة للذاكرة مثل CXL (Compute Express Link). قامت منصة NVIDIA HGX Rubin الجديدة بزيادة عرض النطاق الترددي لذاكرة GPU بمقدار 3 مرات ليصل إلى 176 تيرابايت/ثانية. هذان المساران ليسا بديلين لبعضهما البعض، بل هما حلان متكاملان لإعادة تشكيل منطق التعاون بين التخزين والحوسبة عبر سلسلة القيمة بأكملها.

الشبكة: "الشبكة العصبية" لمجموعات الذكاء الاصطناعي

إذا كانت الذاكرة تحل كفاءة نقل البيانات داخل العقدة الواحدة، فإن الشبكة تحل مشكلة تدفق البيانات بين العقد. في مجموعات الذكاء الاصطناعي واسعة النطاق، تحتاج مئات أو آلاف وحدات GPU إلى العمل معًا لإكمال مهمة تدريب أو استدلال لنموذج واحد، وتؤثر كفاءة الاتصال بين وحدات GPU بشكل مباشر على سرعة التدريب الإجمالية.

عنق الزجاجة الحالي في عرض النطاق الترددي متعدد المستويات: بين الشرائح، لم يعد الاتصال التقليدي عبر اللوحات المطبوعة (PCB) قادرًا على تلبية متطلبات عرض النطاق الترددي العالي وزمن الوصول المنخفض لشرائح الذكاء الاصطناعي؛ داخل الخزانات، أصبح عرض النطاق الترددي للربط البيني بين الخوادم عائقًا أمام التوسع الرأسي؛ بين مراكز البيانات، يحد عرض النطاق الترددي وزمن الوصول للإرسال لمسافات طويلة من كفاءة التوسع الأفقي وجدولة قوة الحوسبة عبر المناطق. وفقًا للتقديرات، في مجموعات تدريب الذكاء الاصطناعي الحالية، تجاوز استهلاك الطاقة لنقل البيانات استهلاك الطاقة للحوسبة نفسها.

تهيمن تقنيات NVIDIA NVLink وInfiniBand منذ فترة طويلة على سوق الربط البيني الداخلي لمجموعات الذكاء الاصطناعي. يبلغ عرض النطاق الترددي لأحدث مفتاح NVLink Switch 28.8 تيرابايت/ثانية، بزيادة مضاعفة عن الجيل السابق. لكن هذا المشهد يتعرض للتحدي - شركات مثل AMD وBroadcom تدفع بحلول الربط البيني الخاصة بها، كما أن المعايير المفتوحة مثل UALink (Ultra Accelerator Link) تتشكل بسرعة. في عام 2026، انتقل سوق الشبكات من "احتكار NVIDIA" إلى "منافسة متعددة المعايير"، مما يضع متطلبات أعلى على قدرات التكامل النظامي لمشغلي مراكز البيانات.

التخزين: من "مستودع" إلى "خط أنابيب بيانات"

في مراكز البيانات التقليدية، كان دور التخزين هو "مستودع البيانات" - يستخدم أساسًا لحفظ وأرشفة البيانات الباردة. لكن في مراكز بيانات الذكاء الاصطناعي، تطور دور التخزين ليصبح "خط أنابيب بيانات" - حيث يحتاج إلى تغذية عقد الحوسبة ببيانات التدريب باستمرار وبسرعة عالية جدًا، ودعم قراءة معلمات النموذج بزمن وصول منخفض في سيناريوهات الاستدلال.

يتطلب تدريب الذكاء الاصطناعي قراءة سريعة لكميات هائلة من البيانات الأولية، بينما يتطلب الاستدلال وصولًا سريعًا لأوزان النموذج وذاكرة التخزين المؤقت KV. بدأت ذاكرة KV بالانتقال من ذاكرة HBM في GPU إلى ذاكرة DRAM للنظام، وحتى إلى أقراص SSD عالية السرعة محليًا. هذا يعني أن الحدود بين التخزين والذاكرة أصبحت غير واضحة، وأجهزة التخزين لم تعد مجرد نقطة نهاية للبيانات، بل أصبحت عقدة رئيسية في خط أنابيب تدفق البيانات.

يحل التخزين القائم على الفلاش (All-Flash) محل الأقراص الصلبة التقليدية كخيار رئيسي لمراكز بيانات الذكاء الاصطناعي. منتجات التخزين الفلاشي الكامل ومنتجات الربط البيني عالية السرعة الأصلية التي عرضتها شركة Sugon في مؤتمر ISC High Performance 2026 هي دليل صناعي على هذا الاتجاه. يحدد أداء التخزين بشكل مباشر ما إذا كان يمكن تسليم البيانات إلى وحدات الحوسبة في الوقت المناسب، وبالتالي تحديد معدل استخدام GPU.

التنسيق بين "الحوسبة والتخزين والشبكة": من التحسين الفردي إلى تحسين النظام

بعد فهم الأدوار والعنق الزجاجية لكل منها، يصبح معنى "التنسيق" واضحًا: قوة الحوسبة الحقيقية لمركز بيانات الذكاء الاصطناعي ليست مجرد مجموع قوة حوسبة GPU وعرض نطاق الذاكرة وإنتاجية الشبكة وIOPS التخزين، بل هي المخرجات الفعالة بعد دمج الأربعة على مستوى النظام.

يؤدي النمو المستمر لحجم معلمات النماذج الكبيرة إلى ظهور مجموعات ذكاء اصطناعي فائقة، ولم تعد سهولة استخدام قوة الحوسبة تعتمد فقط على أداء الشريحة، بل تعتمد بشكل متزايد على قدرات وكفاءة التنسيق الشاملة للحوسبة والتخزين والشبكة داخل المجموعة. هذا الحكم أصبح إجماعًا صناعيًا.

من منظور الممارسة الصناعية، أصبح التصميم المترابط "الحوسبة والتخزين والشبكة" هو المعيار السائد لكبار المصنعين. تتبنى منصة Sugon scaleX AI الفائقة مفهوم التصميم المترابط للحوسبة والتخزين والشبكة، مما يحسن بشكل كبير كفاءة التدريب والاستدلال. يعمل نظام استدلال NVIDIA Dynamo 1.0 مع منصة BlueField-4 CMX على ربط طبقات وسائط متعددة: GPU وHBM وذاكرة DRAM المضيفة والفلاش المحلي والتخزين عن بعد، وذلك من خلال التوجيه التلقائي للبيانات الساخنة والباردة لكسر عزلة ذاكرة البطاقة الواحدة.

أشارت IDC في تقريرها الصادر في يونيو 2026 بوضوح إلى أن الميزة التنافسية في مجال الذكاء الاصطناعي قد تحولت: لم يعد المفتاح هو امتلاك أقوى قوة حوسبة، بل كيفية تحويل الذكاء الاصطناعي إلى قدرة أعمال مستدامة بأقل تكلفة للرمز (Token). والمكون الأساسي لتكلفة الرمز هو الكفاءة الإجمالية للحوسبة والذاكرة والشبكة والتخزين.

مشهد السوق: من يستفيد؟

انعكس هذا الاتجاه الصناعي بشكل كامل في سوق رأس المال.

على جانب الذاكرة، تعتبر SK Hynix بلا شك الهدف الأكثر سطوعًا في عام 2026. في 22 يونيو 2026، ارتفع سهم SK Hynix بنسبة 6% مسجلاً أعلى مستوى تاريخي عند 2,944,000 وون كوري، متجاوزًا سامسونج ليصبح الأكبر من حيث القيمة السوقية في سوق الأسهم الكورية، بارتفاع منذ بداية العام حتى الآن يتجاوز 349%. كما أظهرت Micron أداءً قويًا، حيث أظهرت نتائج الربع الأخير في الأسبوع الأخير من يونيو تضاعف الإيرادات أكثر من أربع مرات على أساس سنوي، وأعلنت عن 16 اتفاقية توريد طويلة الأجل. ارتفع سهم Micron بنسبة 16% في يوم الإعلان عن النتائج.

على جانب الشبكة، سجل سهم شركة Corning (GLW) المصنعة لمنتجات الألياف الضوئية أعلى مستوى تاريخي له في الأسبوع الأخير من يونيو. يتم إعادة تقييم دور منتجات الألياف الضوئية في مراكز بيانات الذكاء الاصطناعي من قبل السوق. تجاوزت طلبات Cisco للبنية التحتية للذكاء الاصطناعي 9 مليارات دولار.

على جانب الخوادم وتكامل الأنظمة، بلغت الإيرادات ربع السنوية لخوادم Dell المحسنة للذكاء الاصطناعي 16.1 مليار دولار، بزيادة 757% على أساس سنوي. تمتلك Supermicro حصة سوقية تبلغ حوالي 70% في تقنية التبريد السائل المباشر.

على جانب تشغيل مراكز البيانات، أدرج بنك Communication International (BOCOM Intl) شركتي GDS-SW وSUNEVISION كأفضل أهداف شراء في قطاع مراكز البيانات، معتبرًا أن الذكاء الاصطناعي التوليدي قد فجر نموًا هائلاً في الطلب. وأشار UBS أيضًا إلى أن صناعة مراكز البيانات الإنترنت الصينية ستتسارع بشكل ملحوظ بدءًا من النصف الثاني من عام 2026.

كيف تشارك في استثمار البنية التحتية لمراكز بيانات الذكاء الاصطناعي عبر منصة Gate؟

أطلقت منصة Gate أكثر من 12,500 سهم وصندوق ETF في أسواق الأسهم الأمريكية والهونغ كونغية والكورية وغيرها. يمكن للمستثمرين استخدام الحساب الموحد لتداول الأسهم العالمية مباشرة باستخدام الأصول الرقمية مثل USDT، مما يتيح تكوين محفظة موحدة من الأصول المشفرة والأوراق المالية التقليدية.

في مجال البنية التحتية لمراكز بيانات الذكاء الاصطناعي، تغطي Gate أهدافًا عبر سلسلة القيمة بأكملها من الرقائق إلى التطبيقات:

في الأسهم الأمريكية، يمكن للمستثمرين تداول أسهم الشركات الأساسية مثل NVIDIA (NVDA)، AMD، Micron (MU)، Broadcom (AVGO)، Dell (DELL)، Supermicro (SMCI)، Corning (GLW)، Cisco (CSCO). تدعم Gate التداول قبل وبعد الجلسة، مع تمديد جلسات التداول إلى 16x5، مما يسمح للمستخدمين بالاستجابة بشكل أكثر فورية لتقارير الأرباح والبيانات الاقتصادية الكلية.

في أسهم هونغ كونغ، يمكن التركيز على مشغلي مراكز البيانات مثل GDS (09698.HK) وSUNEVISION (01686.HK).

في الأسهم الكورية، تعتبر SK Hynix (000660.KS) الرائد المطلق في مجال ذاكرة HBM؛ وتلعب Jeju Semiconductor دورًا رئيسيًا كمواد بصرية للاتصالات في مراكز بيانات الذكاء الاصطناعي.

يدعم تداول الأسهم في Gate رسومًا منخفضة تصل إلى 0.1%، والتداول بالرافعة المالية ووضعي التداول الفوري، حيث يحصل المستخدمون على أسعار VIP خاصة عند الاحتفاظ بـ 2,000 دولار أمريكي في المحفظة. بالنسبة للمستثمرين الذين يسعون إلى تكوين محفظة منظمة في قطاع البنية التحتية لمراكز بيانات الذكاء الاصطناعي، فإن قدرة Gate على التداول عبر الأسواق والأصول المتعددة في محطة واحدة تخفض حاجز الدخول إلى تكوين الأصول التكنولوجية العالمية.

خاتمة

تنتقل مراكز بيانات الذكاء الاصطناعي من العصر الخشن "لتكديس وحدات GPU" إلى العصر الدقيق "لتحسين النظام". لم تعد الذاكرة والشبكة والتخزين مكونات بنية تحتية معزولة، بل أصبحت متغيرات نظام تحدد معًا الإنتاج الحقيقي لقوة حوسبة الذكاء الاصطناعي ضمن إطار التنسيق "الحوسبة-التخزين-الشبكة".

فهم هذا المنطق لا يساعد فقط في تقييم الاتجاهات التكنولوجية، بل يوفر أيضًا إطار تحليل أكثر قوة لاتخاذ قرارات الاستثمار - من الرقائق إلى الذاكرة، ومن الشبكة إلى التخزين، ومن الخوادم إلى تشغيل مراكز البيانات، إعادة تقييم قيمة سلسلة القيمة بأكملها قد بدأت للتو. وعندما يتقاطع التقلب قصير المدى لسوق الأصول المشفرة مع السردية طويلة المدى للبنية التحتية للذكاء الاصطناعي، تفتح نافذة تكوين محفظة تعبر بين الأصول الرقمية والصناعة الحقيقية.

الأسئلة الشائعة

س1: لماذا لا يمكن حل مشكلة قوة الحوسبة لمراكز بيانات الذكاء الاصطناعي بمجرد تكديس وحدات GPU؟

وحدات GPU هي مجرد نهاية إخراج قوة الحوسبة، وتعتمد فعاليتها بشكل كبير على ما إذا كان عرض نطاق الذاكرة يمكنه توفير البيانات في الوقت المناسب، وما إذا كانت الشبكة يمكنها تنسيق التوازي متعدد البطاقات بكفاءة، وما إذا كان التخزين يمكنه الاستجابة بسرعة لقراءة وكتابة كميات هائلة من البيانات. في مجموعات تضم عشرة آلاف بطاقة GPU، يمكن أن يصل وقت خمول GPU الناتج عن عنق زجاجة الإدخال/الإخراج للبيانات إلى أكثر من 40% - مجرد تكديس وحدات GPU دون حل تنسيق هذه العناصر الثلاثة يؤدي إلى هدر هائل لقوة الحوسبة.

س2: لماذا تعتبر ذاكرة HBM نادرة جدًا؟

ذاكرة HBM (الذاكرة عالية النطاق الترددي) هي الذاكرة القياسية لشرائح الذكاء الاصطناعي، وعملية تصنيعها معقدة، ودورة توسيع الإنتاج تتجاوز عامين. في عام 2026، تجاوز طلب استدلال الذكاء الاصطناعي سيناريوهات التدريب، مما زاد الطلب على HBM وذاكرة DRAM عالية السعة. تم حجز الإنتاج الرئيسي من قبل العملاء الكبار مسبقًا حتى عامي 2026 أو 2027، ومرونة العرض على المدى القصير محدودة للغاية.

س3: ما هو المنطق الأساسي لاستثمار البنية التحتية لمراكز بيانات الذكاء الاصطناعي؟

المنطق الأساسي هو الانتقال من "الهيمنة على التدريب" إلى "انفجار الطلب على السلسلة الكاملة". بلغ إجمالي الإنفاق الرأسمالي على البنية التحتية للذكاء الاصطناعي لأربع شركات تكنولوجية عملاقة (Microsoft وGoogle وAmazon وMeta) في عام 2026 حوالي 725 مليار دولار. لا يمكن تحمل هذا المبلغ من خلال حلقة واحدة، وسلسلة القيمة بأكملها - من الرقائق والذاكرة والشبكة إلى تشغيل مراكز البيانات - في دورة استفادة هيكلية.

س4: كيف يمكن تداول أسهم مراكز بيانات الذكاء الاصطناعي ذات الصلة عبر منصة Gate؟

أطلقت Gate أكثر من 12,500 سهم وصندوق ETF في أسواق الأسهم الأمريكية والهونغ كونغية والكورية. يمكن للمستخدمين إيداع الأصول الرقمية مثل USDT وتداول الأهداف الأساسية للبنية التحتية للذكاء الاصطناعي مثل NVIDIA وMicron وSK Hynix في حساب موحد، مع دعم التداول قبل وبعد الجلسة، والتداول بالرافعة المالية والوضع الفوري، برسوم تصل إلى 0.1%.

س5: ما هي مخاطر الاستثمار في البنية التحتية لمراكز بيانات الذكاء الاصطناعي؟

تشمل المخاطر الرئيسية: أولاً، قد يؤدي عدم التوازن بين العرض والطلب إلى فائض مؤقت - يشير BOCOM Intl إلى ضرورة الانتباه إلى عدم التوازن المحتمل في العرض والطلب وتقلبات التقييم على المدى الطويل؛ ثانيًا، مسألة استدامة الإنفاق الرأسمالي لمقدمي الخدمات السحابية فائقي الحجم - يشير JPMorgan إلى أن نمو الإنفاق الرأسمالي بين 2025 و2026 يتجاوز بكثير نمو الإيرادات الفعلية، مما يضغط على التدفق النقدي؛ ثالثًا، اضطرابات سلسلة التوريد الناتجة عن التوترات الجيوسياسية وضوابط التصدير على الرقائق المتقدمة.

BTC%1.00-
ETH%0.46
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت