من سقوط إيربيتا إلى صعود ميكرون: إعادة بناء المنطق الأساسي لرقائق التخزين

في عام 2012، أعلنت شركة إربيدا، أكبر مصنع للذاكرة DRAM على مستوى العالم، إفلاسها رسميًا.

كشركة كانت تعتبر معيارًا لصناعة أشباه الموصلات اليابانية، قامت إربيدا بدمج التقنيات الأساسية لثلاثة عمالقة هم NEC، هيتاشي، وماتسوشيتا، وحتى مع تدخل الحكومة اليابانية وتقديم التمويل، لم تتمكن من إنقاذ تدهورها. بعد أن تحملت ديونًا هائلة بقيمة 430 مليار ين ياباني وطلبت حماية من الإفلاس، تم في النهاية استحواذ شركة Micron الأمريكية على الشركة بمبلغ 200 مليار ين ياباني، ومن ثم تم دمجها والتخلص منها تمامًا من ساحة الصناعة.

بالنظر إلى مسيرة تطور الصناعة، كانت شركات مثل إنتل، Texas Instruments، وموتورولا قد دخلت سابقًا سوق DRAM، ثم انسحبت تدريجيًا. استغرقت صناعة الذاكرة وأشباه الموصلات اليابانية بأكملها أقل من عشرين عامًا من الازدهار إلى الانهيار. بعد ذلك، تولت الشركات الكورية الصدارة، حيث استندت سامسونج وSK Hynix إلى دعم حكومي، وشنوا حرب أسعار جريئة على مستوى العالم، مما أدى إلى تضييق مساحة المنافسة أمام جميع الشركات الأخرى.

أما شركة ميكرون، فهي الناجية الأخيرة، وهي الآن الشركة الأمريكية الوحيدة التي تمتلك القدرة على إنتاج شرائح تخزين متقدمة بكميات كبيرة. يقع مقرها في بويزي، إيداهو، وكانت لفترة طويلة في ظل هالة نيفيديا وتايوان لصناعة أشباه الموصلات، ولا تشارك في تصميم وحدات معالجة الرسوميات (GPU)، ولا تضع خططًا لصناعة الشرائح المنطقية. لكن مع تزايد الطلب على قدرات الذكاء الاصطناعي، برزت مشكلة عنق الزجاجة الفيزيائية التي ظلت مغلقة لعقود: الوقت المستغرق لنقل البيانات من وحدة الحساب، والذي تجاوز زمن الحساب نفسه. هذه المشكلة لا يمكن حلها عبر تحسينات برمجية، وإنما تتطلب اختراقات تقنية في الأجهزة، وهو المجال الذي تركز عليه ميكرون منذ أربعين عامًا.

عقبة أساسية في حسابات الذكاء الاصطناعي: جدار الذاكرة كمشكلة مشتركة في الصناعة

في إطار بنية فون نيومان، تكون وحدات المعالجة الرسومية (GPU) ووحدات المعالجة التنسورية (TPU) والذاكرة الرئيسية مستقلة من الناحية الفيزيائية. تحتوي وحدات المعالجة على ذاكرة SRAM صغيرة مدمجة على الشريحة، بينما تُخزن أوزان النماذج الكبيرة والمدخلات بشكل رئيسي في DRAM خارج الشريحة، ويجب أن تمر البيانات عبر وسيط لنقلها بين المناطق باستخدام إشارات كهربائية.

على سبيل المثال، نموذج لغة كبير يتكون من 700 مليار معلمة، ويتطلب دقة FP16 حوالي 140 جيجابايت من الذاكرة الفيزيائية فقط للأوزان. حاليًا، تتراوح سعة ذاكرة بطاقات الذكاء الاصطناعي عالية الأداء بين 80 جيجابايت و192 جيجابايت، مما يضطر إلى تقسيم النماذج الكبيرة على عدة بطاقات للعمل بشكل متزامن. على مدى العقد الماضي، شهدت قدرة المعالجة في الشرائح قفزات أُسّية، لكن عرض النطاق الترددي للذاكرة لا يزال محدودًا بسبب عدد الأرجل الفيزيائية، وتردد الإشارات، والحدود الحرارية، مما يجعل معدل النمو أبطأ بكثير من تطور القدرة الحسابية. عندما يتجاوز الأداء الحسابي قدرة الذاكرة على التزويد، تتوقف وحدات المعالجة عن العمل وتنتظر، مما يقلل بشكل كبير من كفاءة استخدام الأجهزة.

يُقسم الذكاء الاصطناعي إلى سيناريوهين رئيسيين: التدريب والاستدلال، ويختلفان بشكل كبير من حيث المنطق الأساسي. خلال مرحلة التدريب، يتم التعامل مع كميات ضخمة من البيانات بشكل متوازي، حيث يتم استدعاء نفس البيانات مرارًا وتكرارًا في ذاكرة الكاش الخاصة بوحدة الحساب، مما يزيد من كثافة العمليات الحسابية، ويتركز عنق الزجاجة في سرعة الحساب وليس في الذاكرة، وهو سيناريو حسابي مكثف، حيث يتم استغلال قوة نيفيديا بشكل كامل.

أما في مرحلة الاستدلال، فالأمر مختلف تمامًا، حيث تعتمد نماذج اللغة الكبيرة على آلية التوليد التلقائي (Autoregressive) لإنتاج النص كلمة بكلمة. لتجنب إعادة حساب درجات الانتباه (Attention) للبيانات السابقة، يحتاج النظام إلى بناء آلية تخزين مؤقتة (KV Cache) في الذاكرة. على سبيل المثال، مع سياق يبلغ حوالي 4096 رمزًا، فإن طلب واحد من المستخدم يشغل حوالي 1.34 جيجابايت من الذاكرة؛ وإذا استُخدمت بطاقتان A100، فبعد خصم أوزان النموذج، يتبقى فقط 20 جيجابايت للاستخدام في KV Cache، وهو ما يكفي فقط لـ 14 طلبًا متزامنًا. كثافة العمليات الحسابية في الاستدلال منخفضة جدًا، والأداء يعتمد بشكل كامل على عرض النطاق الترددي للذاكرة، وهو سيناريو يعتمد على كثافة الوصول إلى الذاكرة، حيث أن معدل النقل الفيزيائي لـ HBM يحدد مباشرة الحد الأقصى لعرض المعالجة.

من حيث استهلاك الطاقة، فإن قراءة بت واحد من خارج الشريحة عبر HBM يستهلك حوالي 10-20 بيكو جول، بينما عملية حساب عائمة واحدة من نوع FP16 تستهلك فقط 0.1 بيكو جول، أي أن استهلاك الطاقة لنقل البيانات يفوق استهلاك الحساب بمقدار 100 إلى 200 مرة. في سيناريوهات الاستدلال واسعة النطاق، إذا لم يتم تحسين نمط الوصول إلى الذاكرة، فإن الكثير من الطاقة ستُهدر في نقل البيانات عبر الناقل، بدلاً من العمليات المنطقية الفعلية، وهو الدافع الرئيسي وراء استثمار ميكرون المستمر في تقنية HBM.

الأساسيات المالية وتحديد موقع ميكرون في سلسلة التوريد للذكاء الاصطناعي

ميكرون هي شركة IDM (تصنيع مدمج للمكونات)، تدمج تصميم الشرائح، تصنيع الرقائق، والتعبئة والاختبار بشكل كامل، مع تركيز على مصانع الرقائق في مجال الذاكرة، ولا تشارك في تصميم وحدات المعالجة الرسومية أو الشرائح المنطقية. تركز على تطوير وإنتاج منتجات الذاكرة والتخزين.

من حيث هيكل الإيرادات، تساهم شرائح DRAM بأكثر من 70% من الإيرادات، وNAND Flash تمثل 20-30%، بينما تشكل NOR Flash حصة أصغر. يُعد DRAM الوسيط الرئيسي للذاكرة العامة، وNAND هو الوسيط الأساسي للأقراص الصلبة ذات الحالة الصلبة (SSD)، وNOR يُستخدم بشكل رئيسي في الإلكترونيات السياراتية والصناعية، حيث يسرع تنفيذ رموز الإقلاع، رغم أنه سوق محدود إلا أنه لا غنى عنه.

أما من ناحية التوزيع، فميكرون تنقسم إلى أربعة قطاعات رئيسية: قطاع شبكات الحوسبة والخوادم، قطاع الأجهزة المحمولة للهواتف الذكية، قطاع الأقراص الصلبة للشركات، وقطاع الأنظمة المدمجة للسيارات والصناعات.

في سلسلة التوريد الخاصة بالذكاء الاصطناعي، تتولى نيفيديا تصميم وحدات GPU، وتقوم TSMC بتصنيع الرقائق، بينما ميكرون، رغم عدم مشاركتها في هذين القطاعين، فهي المورد الأساسي لمكونات تسريع الذكاء الاصطناعي. لا يمكن لوحدة GPU المنطقية دعم تشغيل نماذج كبيرة بمفردها، إذ أن عنق الزجاجة في الأداء خلال الاستدلال هو عرض النطاق الترددي للذاكرة، لذلك تتطلب وحدات GPU دمج ذاكرة HBM عالية النطاق. وتعد ميكرون، إلى جانب SK Hynix وسامسونج، من الموردين الرئيسيين لـ HBM، حيث تُدمج منتجاتها في وحدات AI الكاملة عبر تغليف CoWoS المتقدم من TSMC، معتمدين على أنظمة عالية الأداء، حيث أن وحدة GPU تمثل “عقل” القدرة الحسابية، وHBM هو قناة نقل البيانات عالية السرعة، ولا يمكن الاستغناء عن أحدهما.

من حيث استراتيجيات المنافسة، تعتمد نفيديا على بناء حصن من خلال الهيكلية والنظام البيئي، بينما تواصل ميكرون تطوير تقنيات التصنيع والتغليف لبناء حواجز صناعية. كل جيل من HBM يرفع عرض النطاق الترددي، ويعتمد على تقنيات TSV الدقيقة وعدد طبقات التكديس الأعلى، مما يرفع حاجز الدخول التقني بشكل كبير.

DRAM: البنية التحتية الأساسية وراء القدرة الحسابية للذكاء الاصطناعي

في بنية الحواسيب التقليدية، تُستخدم DRAM كذاكرة رئيسية، وتُعد مثالية لمواجهة مشكلة الفرق في السرعة بين التخزين الكبير منخفض السرعة، والمعالج عالي السرعة مع ذاكرة مؤقتة صغيرة. عند تشغيل البرامج، يتم تحميل البيانات من القرص الصلب إلى DRAM، ويقوم المعالج بتنفيذ عمليات القراءة والكتابة بسرعة عالية مع تأخير نانوسيلي، وتظل نواة النظام والعمليات الخلفية دائمًا في الذاكرة. تتميز DRAM بخصيصة فقدان البيانات عند انقطاع التيار، حيث أن المكثفات الداخلية تتسرب بشكل طبيعي، مما يتطلب تحديثًا مستمرًا للحفاظ على البيانات، والوحدة الأساسية تتكون من ترانزستور ومكثف.

مع دخول عصر الذكاء الاصطناعي، أعيد تشكيل تطبيقات واحتياجات DRAM بشكل كامل. تحولت وحدات المعالجة من CPU إلى GPU، ولم تعد DRAM تقتصر على شرائح DDR على اللوحة الأم، بل أصبحت على شكل ذاكرة عالية النطاق الترددي (HBM)، حيث تُكدس عموديًا باستخدام تقنية TSV، وتُدمج مع وحدة GPU في طبقة وسيطة من السيليكون.

حاليًا، يركز قيمة DRAM الأساسية على بعدين رئيسيين: الأول هو تحميل أوزان النماذج الكبيرة، حيث يتطلب نموذج بـ 700 مليار معلمة في صيغة FP16 حوالي 140 جيجابايت من التخزين، ويجب تحميلها بالكامل في HBM قبل الاستدلال؛ والثاني هو استخدام KV Cache بشكل ديناميكي، حيث يحتاج النموذج إلى تخزين السياق التاريخي أثناء توليد النص، وكلما زاد طول السياق، زاد استهلاك الذاكرة، ويحد ذلك من قدرة الخادم على التعامل مع الطلبات المتزامنة. في سيناريو التدريب، يكون استهلاك الذاكرة أكبر بكثير، حيث يتطلب الاحتفاظ بمعلمات النموذج ونتائج الحساب الوسيطة، بالإضافة إلى البيانات الإضافية من المُحسِّن، مما يجعل الحاجة إلى الذاكرة تصل إلى ثلاثة إلى أربعة أضعاف استهلاكها في الاستدلال.

بسبب جدار الذاكرة، فإن معدل نمو القدرة الحسابية لوحدات GPU يتجاوز بكثير معدل تطور عرض النطاق الترددي للذاكرة، مما يؤدي إلى توقف وحدات GPU بشكل متكرر أثناء الاستدلال، ويحدد ترقية عرض النطاق الترددي لـ HBM الحد الأقصى لعدد الطلبات التي يمكن أن يعالجها الخادم، وهو السبب الذي يدفع ميكرون للاستثمار المستمر في تطوير HBM.

نظام الثلاثة الكبار في الذاكرة: سامسونج، SK Hynix، وميكرون يختلفون في التنافس

يسيطر على سوق DRAM العالمي ثلاث شركات رئيسية: سامسونج، SK Hynix، وميكرون، مع حصة سوقية مجمعة تقارب 95%. لكل شركة ميزاتها الأساسية.

في مجال التكرير، تتصدر ميكرون الصناعة، حيث حققت تقدمًا من 1-alpha إلى 1-beta ثم 1-gamma، وبدأت في إنتاج شرائح DRAM عالية الكثافة من الجيل الجديد بشكل مبكر، مع إنتاج رقائق أكثر لكل وحدة، وتكلفة أقل لكل بت، وهو ما يمنحها ميزة في الهامش الربحي. تواجه سامسونج مشاكل في معدل النجاح عند تصنيع أقل من 14 نانومتر، مما يبطئ وتيرة التكرير؛ بينما تتقدم SK Hynix في نفس مستوى ميكرون.

أما في سوق HBM، فالوضع مختلف تمامًا، حيث تسيطر SK Hynix على أكثر من 50% من السوق، وتعد المورد الحصري لبطاقات نفيديا عالية الأداء، معتمدة على تقنية MR-MUF في التغليف متعدد الطبقات، مما يمنحها ميزة في التبريد والتحكم في معدل النجاح. ميكرون، التي دخلت السوق لاحقًا، تتخطى HBM3 وتستهدف مباشرة HBM3E، معتمدة على كفاءة الطاقة، وتستخدم تقنية TC-NCF، لكن صعوبة التصنيع أعلى، وحصتها السوقية أقل من SK Hynix. فشلت سامسونج في اختبار نفيديا في مراحل HBM3 وHBM3E بسبب مشاكل في الحرارة والطاقة، وفقدت فرصة الاستفادة من سوق الذاكرة AI، وتراهن الآن على HBM4 لتحقيق التفوق.

أما من ناحية كفاءة الطاقة، فتُعد ميكرون نقطة تميز، حيث أن استهلاكها للطاقة أقل بنسبة 20-30% عند نفس عرض النطاق الترددي مقارنة بالمنافسين، وهو فرق يبدو بسيطًا، لكنه يمكن أن يوفر بشكل كبير في مراكز البيانات التي تحتوي على عشرات الآلاف من البطاقات، من خلال تقليل تكاليف الكهرباء والتبريد. بالإضافة إلى ذلك، فإن تقنية LPDDR5X من ميكرون بسرعة 9.6 جيجابت في الثانية، مع انخفاض استهلاك الطاقة بنسبة 30%، تتوافق تمامًا مع متطلبات عمر البطارية في الأجهزة المحمولة.

أما من حيث القدرة الإنتاجية، فسامسونج تتصدر السوق بفضل حجمها الكبير، وتستطيع السيطرة على السوق عبر حرب الأسعار؛ بينما ميكرون تتجنب المنافسة السعرية المباشرة، وتركز على القيمة التقنية، وتستخدم تقدمها في التكرير وكفاءة الطاقة للحفاظ على حصتها السوقية.

بالإضافة إلى DRAM وHBM، تشكل NAND وNOR Flash مسار النمو الثاني لميكرون. تحتل NAND حصة تتراوح بين 10-15% من السوق العالمية، وتحتفظ بمكانتها كخامس أكبر مزود، مع استمرارها في السوق. أما NOR، فهي تتخلى عن السوق الاستهلاكية منخفضة الجودة، وتركز على مجالات السيارات والصناعات عالية الجودة، وتدير معيار واجهة عالية السرعة Octal xSPI، معتمدًا على أعلى معايير الأمان ASIL-D، وتوفر منتجاتها من خلال مصانعها الخاصة لسنوات طويلة، وتربطها علاقات مع عملاء رئيسيين في السيارات والصناعات، وتبتعد عن حرب الأسعار، وتحقق أرباحًا من الاعتمادية والأداء.

المنطق التقييمي لقيمة ميكرون ومقارناتها مع المنافسين

حاليًا، سعر سهم ميكرون حوالي 600 دولار، ونسبة السعر إلى الأرباح 21.44، وقيمتها السوقية حوالي 650 مليار دولار. تتوقع البنوك الاستثمارية خلال 12 شهرًا أن يتراوح سعر الهدف بين 400 و675 دولار، ومتوسطها يقارب 500 دولار، مما يشير إلى أن التقييم العام منخفض.

كانت شرائح الذاكرة سابقًا صناعة ذات دورة قوية، حيث تؤدي حالة السوق إلى توسع في القدرة الإنتاجية، ثم فائض في المعروض وانخفاض الأسعار، وغالبًا ما يُعطى لها تقييم بين 8 إلى 10 أضعاف الأرباح. الآن، ارتفعت قيمة ميكرون بشكل كبير، ويرجع ذلك إلى إعادة هيكلة إيرادات HBM: فذاكرة DDR التقليدية تتأثر بشكل كبير بتقلبات السوق، بينما HBM تعتمد على عقود إنتاج طويلة الأمد مع عملاء كبار مثل نفيديا، حيث تم بيع كامل طاقتها الإنتاجية من HBM بحلول 2026، وتحول الإيرادات من تقلبات دورية إلى دخل ثابت من العقود، مما أدى إلى تصنيفها كمورد للبنية التحتية للذكاء الاصطناعي، ورفع مضاعفات التقييم.

بالإضافة إلى ذلك، فإن الدعم السياسي والمالي يعزز مكانة ميكرون كشركة تصنيع تخزين متقدمة في أمريكا، مستفيدة من قانون الرقائق وسلسلة التوريد المحلية، مع استمرار تدفق الاستثمارات من المؤسسات، مما يمنحها علاوة على السيولة.

أما من ناحية المنافسين، فإن SK Hynix يُقدر سعر سهمها بنسبة 12.17، رغم أنها تسيطر على أكثر من نصف سوق HBM، وتربطها علاقات طويلة الأمد مع نفيديا، إلا أن هيكلتها المالية في كوريا الجنوبية، مع توزيع أرباح منخفض، ووجود حوالي 40% من طاقتها الإنتاجية في الصين، يواجه قيود تصدير المعدات الأجنبية، مما يحد من قدرتها على التحديث، ويعرضها لمخاطر نقل القدرة وتدهور الأصول، مما يضغط على تقييمها.

أما سامسونج، فتبلغ نسبة السعر إلى الأرباح 34.18، وهو ليس تقييمًا مرتفعًا، بل يعكس تدهور صافي الأرباح بسبب ضعف الأداء في قطاعاتها المتنوعة، خاصة في التصنيع، حيث أن استثماراتها في التقدم التكنولوجي عالية، لكن معدلات النجاح منخفضة، وتؤدي إلى خسائر مستمرة، مما يثقل على أرباحها، ويظل سعر سهمها ثابتًا بدعم من التمويل المحلي، مما يرفع نسبة التقييم.

أما من المنظور الاستثماري، فإن المنطق الرئيسي في تقييم ميكرون واضح: زيادة حصة إيرادات HBM تدفع هامش الربح للارتفاع؛ العقود طويلة الأمد تضمن استقرار الإيرادات؛ التوجه نحو HBM يقلل من إمدادات DRAM العادية، ويدعم ارتفاع الأسعار؛ بعد بدء الإنتاج على تقنية 1-gamma، تدخل الشركة في فترة عائدات رأس المال، وتحسن التدفقات النقدية الحرة بشكل مستمر. ومع ذلك، يجب الانتباه إلى أن دورة صناعة الذاكرة لم تنتهِ تمامًا، وأن استقرار إيرادات HBM فقط يخفف من تقلبات السوق، وإذا تباطأ الاستثمار في البنية التحتية للذكاء الاصطناعي، أو تفوقت سامسونج في تقنية HBM4، فقد يعيد ذلك تشكيل سوق العرض والطلب.

معايير تقييم HBM والجيل القادم من تقنيات الاتصال CXL

تُركز جميع الشركات على مزايا منتجات HBM الخاصة بها، ويُعد تقييم جودة HBM قائمًا على ثلاثة معايير رئيسية:

الأول هو سرعة الأرجل، التي تحدد عرض النطاق الترددي لنقل البيانات. تعتمد HBM على تقنية التوصيل عبر نقاط التلامس الدقيقة (micro-bumps) مع وحدة المعالجة الرسومية، وتُعبر سرعة الأرجل عن كمية البيانات التي يمكن نقلها في الثانية عبر قناة واحدة، ويُحدد عرض النطاق الإجمالي وفقًا لمعادلة ثابتة، حيث أن عرض النطاق الإجمالي يعتمد على عدد الأرجل (عادة 1024). تُعلن ميكرون عن HBM3E بسرعة 9.2 جيجابت في الثانية، مع عرض نطاق لكل تكديس حوالي 1.2 تيرابايت في الثانية، متفوقة على المنافسين الذين يحققون بين 8.0 و8.5 جيجابت في الثانية. لكن زيادة السرعة ترفع من استهلاك الطاقة وخطر التشويش في الإشارات، حيث أن التردد العالي يسبب ارتفاع درجة الحرارة نتيجة تقلبات الجهد، مما قد يؤدي إلى أخطاء في الإشارة ويؤثر على استقرار نقل البيانات.

الثاني هو كفاءة الطاقة، وتقاس بوحدة pJ/bit، وكلما كانت القيمة أقل، كانت الكفاءة أعلى. تعمل HBM مع وحدة GPU في تغليف مشترك، وإذا زاد استهلاك الطاقة، فإن ذلك يزيد من عبء التبريد، ويجبر وحدة المعالجة على تقليل التردد أو الأداء. تعتمد ميكرون على تقنية 1-beta ذات الجهد المنخفض، مما يمنحها كفاءة طاقة أعلى بنسبة حوالي 30% مقارنة بالمنافسين، مما يقلل بشكل كبير من تكاليف الكهرباء والتبريد لمراكز البيانات.

الثالث هو مقاومة الحرارة وتقنيات التغليف، وهي من أهم عوامل الحصانة التنافسية لـ SK Hynix. يُحدد ارتفاع درجة الحرارة الناتج عن استهلاك الطاقة ومقاومة التوصيل الحراري، حيث أن الهيكل متعدد الطبقات يصعب نقل الحرارة، ويؤثر نوع المادة المملوءة بين الطبقات على مقاومة التوصيل الحراري. تُستخدم تقنيتان رئيسيتان في الصناعة: TC-NCF وMR-MUF. تعتمد ميكرون وسامسونج على تقنية TC-NCF، التي تتسبب في بقاء فقاعات هوائية أثناء التلاصق، مما يرفع من مقاومة التوصيل الحراري. أما SK Hynix، فتستخدم تقنية MR-MUF، التي تملأ الفجوات بمادة سائلة خالية من فقاعات، وتوفر مقاومة حرارية أقل.

ارتفاع مقاومة التوصيل الحراري يؤدي إلى سلسلة من المشاكل، حيث أن ارتفاع درجة الحرارة يسرع من تسرب التيار من مكثفات DRAM، مما يضطر وحدة التحكم إلى التحديث المتكرر للبيانات، مما يستهلك عرض النطاق الترددي الفعال. كما أن تقنية التغليف تحدد الحد الأقصى لعدد الطبقات المكدسة، وكلما زاد عدد الطبقات، زادت التحديات الميكانيكية والتوافق الحراري، مما يرفع من ضغط تحسين الجودة وتقليل العيوب.

عند دراسة تقنيات HBM، يكفي التركيز على ثلاثة نقاط: جهد الاختبار المعلن، وعدد الطبقات، وسعة كل وحدة، بالإضافة إلى العملاء الرئيسيين الذين يوردون المنتجات، حيث أن الاختبار النهائي من قبل العملاء هو المعيار الحقيقي لمدى قوة التقنية.

CXL: ساحة المعركة القادمة لدمج الذاكرة في تجمعات الحوسبة الذكية

تُعالج تقنية HBM مشكلة عرض النطاق الترددي المحدود داخل وحدة GPU، ولكن مع توسع تجمعات الذكاء الاصطناعي إلى الآلاف من وحدات GPU، تظهر مشكلات تخصيص الموارد غير الفعالة، وتباين الكاش بين الأجهزة، مما أدى إلى ظهور تقنية CXL.

في مراكز البيانات التقليدية، تكون الذاكرة مرتبطة بشكل مادي بجهاز واحد، ولا يمكن مشاركتها بين الأجهزة، مما يؤدي إلى امتلاء KV Cache في بعض العقد، وترك بعض الذاكرات غير مستخدمة، مع معدل فشل يصل إلى 20-30%، مما يسبب هدرًا كبيرًا في رأس المال. بالإضافة إلى ذلك، فإن البيانات المخزنة في ذاكرات CPU وGPU غير متزامنة، وتؤدي طرق المزامنة البرمجية التقليدية إلى تأخيرات عالية، وخسائر في الأداء، وتتطلب تعديل الكود يدويًا، مع ضعف في التحمّل للأخطاء.

تكمن المشكلة الأساسية في قيود بروتوكول PCIe، الذي يقتصر على نقل البيانات الكبيرة، ولا يدعم التوافق بين الكاش. تعتمد تقنية CXL على إعادة بناء بروتوكول PCIe، مع تحسينات موجهة نحو فهم الذاكرة وتوافق الكاش، حيث تقوم الأجهزة تلقائيًا بصيانة علامات حالة الكاش، وتزامن البيانات خلال نانوسكند، دون تدخل من النظام أو الكود. تستخدم صيغة نقل ثابتة (FLIT)، مما يبسط عملية تحليل البيانات، ويقلل من زمن الوصول إلى الذاكرة البعيدة إلى حوالي 170-250 نانوسكند.

بالإضافة إلى ذلك، يمكن لـ CXL إنشاء تجمعات ذاكرة مشتركة عبر محولات، بعيدًا عن الارتباط المادي بجهاز واحد، وتوفير تخصيص ديناميكي للذاكرة غير المستخدمة خلال ميكروثانية، مما يحل مشكلة احتجاز الذاكرة بشكل جذري.

أطلقت ميكرون وحدة توسعة ذاكرة من نوع CXL من الجيل الثالث، تعتمد على تقنية DDR5 المطورة داخليًا، وتُقارن مع HBM في التخصصات: تركز HBM على عرض النطاق الترددي العالي والمنخفض زمن الوصول للبطاقات الفردية؛ بينما تركز CXL على توسيع الذاكرة عبر العقد، ودعم تجمعات موارد تصل إلى تيرابايتات. في التطبيق العملي، يتم الاحتفاظ بالبيانات الساخنة محليًا في HBM، بينما تُنقل البيانات الباردة ذات السياق الطويل إلى تجمعات CXL، باستخدام آلية التنبؤ المسبق لتغطية زمن النقل، مما يدعم نماذج ذات سياق طويل يتجاوز مليون رمز.

في سوق التقنية، يتزايد التنافس على HBM، بينما لا تزال تقنية CXL في مراحلها الأولى، ولم يتحدد المشهد بعد. باعتبار ميكرون شركة متخصصة في التخزين، فهي خالية من الأعباء التاريخية، وتستخدم تقنية DDR5 القياسية، ولا تتطلب عمليات تغليف معقدة، مما يجعلها قادرة على التحكم في جودة الإنتاج والقدرة، مع فرصة لتصدر السوق.

الاقتصاديات الأساسية والتحديات التقنية في المستقبل

تكلف مصانع DRAM المتقدمة بين 150 و200 مليار دولار، ويبلغ سعر جهاز EUV للتصنيع أكثر من 20 مليون دولار، مع استثمارات في أنظمة التبريد والطاقة، وتكاليف استهلاك المعدات على مدى 5 سنوات عالية جدًا، حيث يجب أن تصل نسبة الاستخدام إلى أكثر من 95% لتقليل تكلفة التصنيع. عندما ينخفض الطلب، يصعب على الشركات تقليل الإنتاج، فتضطر إلى الصمود وشن حرب أسعار، وهو السبب الجذري لدورة الصناعة القوية.

تكلفة HBM مرتفعة أيضًا بسبب القيود الفيزيائية، حيث أن كل طبقة من شرائح DRAM تُكدس عموديًا، وأي عيب في طبقة واحدة يؤدي إلى تلف الوحدة بأكملها، مع انخفاض معدل النجاح بشكل أُسّي مع زيادة عدد الطبقات. حتى لو كانت نسبة نجاح الرقائق الفردية 95%، ونجاح التوصيل بين الطبقات 99%، فإن معدل نجاح HBM3E المكون من 8 طبقات يكون حوالي 61%، وHBM4 من 12 طبقة أقل من 50%. تعمل SK Hynix وMicron على تحسين تقنيات التغليف والتصنيع لرفع المعدلات، لكن تحسين المعدلات وزيادة القدرة الإنتاجية لا يمكن أن يحدث بسرعة، مما يحد من انخفاض أسعار HBM على المدى القصير.

تقنية PIM (الذاكرة المعالجة) لم تُستخدم على نطاق واسع منذ عشرين عامًا، ويعود السبب إلى تعارضات في العمليات الفيزيائية. تحتاج ترانزستورات DRAM إلى تقليل التسرب العالي للتيار، ورفع جهد التشغيل لضمان تخزين الشحنة، مما يبطئ من سرعة التبديل؛ بينما تتطلب وحدات المنطق في المعالجات المركزية ووحدات GPU جهد منخفض وسرعة تبديل عالية، مما يسبب تسرب التيار، وتعارضًا في العمليات. إذا حاول دمج وحدات حساب داخل DRAM، فإن الأداء سيكون متأخرًا بشكل كبير عن GPU، كما أن الحرارة الناتجة عن العمليات الحسابية ستسرع من تسرب المكثفات، مما يؤثر على موثوقية البيانات.

النهج الوسيط حاليًا هو دمج وحدات حساب خفيفة داخل قاعدة DRAM باستخدام عمليات تصنيع متقدمة من TSMC، لتجنب قيود عمليات DRAM، لكن الفجوة مع الدمج الحقيقي بين الذاكرة والمعالجة لا تزال كبيرة.

على المدى الطويل، تتضح استراتيجية ميكرون التنافسية: الاعتماد على تقنية 1-gamma لخفض تكلفة البت، مع الحفاظ على أسعار عالية من خلال هوامش ربح عالية على HBM، مع الاعتماد على عقود طويلة الأمد لتنعيم دورة السوق. لكن، لا تزال هناك تحديات هيكلية، حيث أن التصغير الأفقي للذاكرة يقترب من الحدود الفيزيائية، وتدهور معدلات النجاح مع زيادة الطبقات، ولا توجد حاليًا طرق تجارية للدمج بين الذاكرة والمعالجة. المستقبل، لن يعتمد التنافس على التقدم في تقنية واحدة فقط، بل على مهارات تحسين المعدلات، وتقنيات التغليف، والتكامل النظامي، وهو ما يشكل الحصن المنيع الذي بناه عمالقة التخزين على مدى عقود.

من خلال تحليل تطور السوق، يتضح أن دورة صناعة الشرائح دائمًا ما تتكرر: نقص القدرة الحسابية يؤدي إلى زيادة حجم الشريحة، وزيادة الحجم يحد من المعدلات، ثم الانتقال إلى بنية مترابطة يواجه تأخير نقل البيانات، ثم التكديس يواجه مشاكل التبريد، مما يعيق المعدلات مرة أخرى. في النهاية، ستعود المنافسة الحاسمة إلى المواد، حيث قد تكون تقنيات الاتصال الضوئي، المواد ثنائية الأبعاد، والهياكل الحسابية الثورية هي الاتجاهات الأساسية لكسر القيود الفيزيائية الحالية.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت