مؤخرًا، أتيحت لي فرصة للتعمق في شركة ميكرون تكنولوجي. بصراحة، أنا مندهش من ضعف حضور هذه الشركة. فهي مخفية وراء نيفيديا وTSMC، ولا تحظى بالكثير من الاهتمام، ومع ذلك فهي تدعم البنية التحتية للذكاء الاصطناعي.



عند تذكّر الأمر، في عام 2012، عندما أعلنت شركة إلبيدار اليابانية إفلاسها، كانت ميكرون هي التي استحوذت على أصولها. في ذلك الوقت، كانت صناعة ذاكرة DRAM تكاد تختفي من اليابان، وكانت سامسونج وSK Hynix الكوريتان تسيطران على السوق. وفي ظل ذلك، بقيت ميكرون الشركة الأمريكية الوحيدة التي تستطيع إنتاج شرائح ذاكرة عالية الأداء بكميات كبيرة، ونجت.

لماذا يحدث هذا؟ مع التطور السريع للذكاء الاصطناعي، يتحدث الجميع عن سرعة الحوسبة. أداء وحدات معالجة الرسوميات، TFLOPS، القدرة الحسابية. لكن الاختناقات الحقيقية تقع في مكان مختلف تمامًا. وهو عرض نطاق الذاكرة.

حيث يستغرق GPU وقتًا أطول لانتظار البيانات بعد الانتهاء من الحساب، مما يتجاوز وقت الحساب الفعلي. يُطلق على هذا اسم جدار الذاكرة. لتشغيل نموذج يتكون من 700 مليار معلمة، يحتاج إلى حوالي 140 جيجابايت من الذاكرة بصيغة FP16. ذاكرة الفيديو على بطاقات GPU الفاخرة مثل A100 وH100 تتراوح بين 80 و192 جيجابايت تقريبًا. أي أنه يتعين تقسيم البيانات بين عدة بطاقات ومعالجتها.

لحل هذه المشكلة، طورت Nvidia ذاكرة عالية النطاق الترددي، أو HBM، بجانب وحدة المعالجة الرسومية. وهي عبارة عن تجميع عدة طبقات من شرائح DRAM بشكل عمودي، وتعبئتها على لوحة موصل السيليكون. وتقوم ميكرون بإنتاج هذه الذاكرة HBM.

الـ HBM ليست مجرد ذاكرة، بل يمكن القول إنها قلب الحوسبة الذكية. في مرحلة الاستدلال، يكون الحمل الحسابي لوحدة المعالجة الرسومية منخفضًا جدًا، ويقيد النظام بالكامل عرض النطاق الترددي للذاكرة. الطاقة المستهلكة لنقل البيانات تتجاوز بكثير الطاقة المستخدمة في العمليات الحسابية، بمقدار 100 إلى 200 مرة. أي أن الجزء الأكبر من استهلاك الطاقة في مراكز البيانات يُستخدم لنقل البيانات عبر الناقل.

السبب في عدم شهرة ميكرون هو أنها لم تقدم ابتكارات معمارية لافتة. Nvidia تبتكر في تصميم وحدات المعالجة الرسومية، وTSMC تبتكر في عملية تصنيع شرائح المنطق. أما ميكرون، فهي تعمل بشكل هادئ، ولكن بشكل جوهري، من خلال تحسين تقنية العمليات في عملية غاما، والتجميع المعقد للطبقات، وتحسين كفاءة الطاقة.

تصنيع الـ HBM يتطلب تكديس عدة طبقات من شرائح DRAM بشكل عمودي، وإذا كانت هناك عيوب في أي طبقة، فإن الوحدة بأكملها تصبح غير قابلة للاستخدام. معدل النجاح الإجمالي لـ HBM3E ذو 8 طبقات هو حوالي 61%. وعند زيادة الطبقات إلى 12 في HBM4، ينخفض إلى 48%. تأثير كل طبقة يتراكم بشكل تضاعفي، وليس جمعي.

سيطرة SK Hynix على أكثر من 50% من سوق الـ HBM تعود إلى تقنيتهم في تغليف السيليكون السائل MR-MUF، التي تحسن بشكل مباشر معدل نجاح الربط بين الطبقات. من ناحية أخرى، تعتمد ميكرون على عملية TC-NCF، التي تتفوق على Hynix في التوصيل الحراري، لكن ذاكرات HBM من ميكرون تستهلك طاقة أقل بنسبة 20-30%، مما يميزها من حيث كفاءة الطاقة.

سوق الـ DRAM العالمي يسيطر عليه ثلاث شركات: سامسونج، SK Hynix، وميكرون، بنسبة 95%. لكن مواقفها مختلفة تمامًا. ميكرون تتقدم بسرعة أكبر في تكنولوجيا العمليات، وتزيد كثافة الذاكرة على الرقاقة، وتقلل من تكلفة التصنيع لكل بت.

سامسونج تواجه مشاكل في معدل النجاح عند استخدام عملية أقل من 14 نانومتر، مما يبطئ وتيرة التوريد. وتطور SK Hynix في العمليات يتساوى تقريبًا مع ميكرون.

نسبة السعر إلى الأرباح لأسهم ميكرون تبلغ 21 مرة، وهو ارتفاع كبير مقارنة بـ8-10 مرات للشركات التقليدية في الذاكرة. السبب هو نظام الطلب المسبق على منتجات HBM. فهي تبرم عقود توريد طويلة الأمد مع عملاء مثل Nvidia، وتثبت الأسعار والكميات مسبقًا. ويُقال إن القدرة الإنتاجية لـ HBM في 2026 قد بيعت بالكامل.

هذا قلل بشكل كبير من تقلبات سوق الذاكرة. وتقييم وول ستريت لهذا الأمر أدى إلى إعادة تصنيف ميكرون كمزود للبنية التحتية. بالإضافة إلى ذلك، فإن الخلفية الجيوسياسية التي تتطلب من الولايات المتحدة تعزيز قدراتها في تصنيع الذاكرة المتقدمة داخل البلاد زادت من تدفق الاستثمارات.

المعركة القادمة لـ HBM هي CXL. وهو اختصار لـ Compute Express Link، وهو بروتوكول يتيح مشاركة الذاكرة بين عدة خوادم، مع إدارة تلقائية لتوافق الكاش. في مراكز البيانات ذات السعة الكبيرة، تصل نسبة الذاكرة غير المستخدمة إلى 20-30%. يمكن حل ذلك عبر pooling للذاكرة باستخدام CXL.

أعلنت ميكرون عن وحدة توسعة ذاكرة من نوع CXL من الطراز 3. ذاكرة HBM توفر عرض نطاق ترددي عالٍ جدًا، يصل إلى مئات الجيجابايتات، مع زمن استجابة منخفض، بينما توفر وحدات CXL سعة تيرابايتات، مع مرونة في تخصيص الذاكرة. باستخدام كلاهما معًا، يمكن نقل البيانات الساخنة التي تتطلب وصولًا متكرر إلى الذاكرة المحلية من نوع HBM، والبيانات الباردة إلى تجمع ذاكرة CXL.

إذا أردت أن تجيب على سؤال "ما هو الـ HBM؟"، فسيكون ذلك: إنه ليس مجرد ذاكرة، بل هو نتاج حتمي لتطور بنية الذكاء الاصطناعي. مع نمو القدرة الحسابية بشكل يفوق بكثير نمو عرض النطاق الترددي للذاكرة، فإن الحل الوحيد لهذا الاختناق الفيزيائي هو الـ HBM.

على المدى الطويل، ستواجه صناعة أشباه الموصلات حدود علم المواد. فالتصغير الأفقي يقترب من الحدود الفيزيائية، وانخفاض معدل نجاح التصنيع في التكديس الثلاثي الأبعاد يتزايد بشكل أسي. كما أن الحوسبة داخل الذاكرة تواجه تناقضات جوهرية في العمليات. فترانزستورات DRAM تتطلب جهد خرج منخفض، بينما تتطلب شرائح المنطق جهدًا منخفضًا أيضًا، لكن بنقطة عتبة مختلفة. هذان الاحتياجان يتناقضان تمامًا.

وفي النهاية، تعتمد قدرة ميكرون التنافسية على قدراتها الشاملة، التي تقلل من الأخطاء أكثر من منافسيها في مجالات تحسين معدل النجاح، وعمليات التعبئة والتغليف، ودمج الأنظمة. وتراكم هذه القدرات يتطلب عقودًا من الخبرة التصنيعية، وهو ما يمثل الحصن الحقيقي.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت