بودكاست All In، الحلقة الأخيرة، كيف ينظر كبار الخبراء إلى ميكرون؟ اختناق التخزين؟ النماذج المفتوحة المصدر الصينية؟ والتوزيع الموزع؟



هذه الحلقة من All In Podcast تحتوي على الكثير من المعلومات، سأختار أهم المواضيع التي أعتقد أنها تستحق المشاركة.

أولاً، خط النماذج المفتوحة المصدر الصينية، التقدم أسرع من المتوقع.

أطلقت Zhipu AI الجيل الجديد من النموذج مفتوح المصدر من فئة Frontier GLM 5.2، بـ 744 مليار معلمة، وسياق 100 ألف رمز، باستخدام ترخيص MIT بالكامل. بيانات التقييم مذهلة: في اختبار البرمجة الهندسية القياسي، تفوق على GPT-5.5، ويبعد أقل من 1% عن أفضل نموذج لـ Anthropic Claude Opus 4.8، لكن سعر واجهة برمجة التطبيقات أرخص بنسبة 85% مقارنة بالنماذج الأمريكية المماثلة في الأداء.

هناك تفصيل مثير للاهتمام في البرنامج، يتعلق بطريقة تسريع الفرق الصينية: استخدام آلاف الهواتف وأجهزة iPad لتشكيل مزارع أجهزة، واستخدام حسابات مشفرة لإرسال استفسارات عالية الكثافة إلى واجهات برمجة التطبيقات لأفضل النماذج الأمريكية Frontier، لالتقاط سلاسل الاستدلال الخاصة بهم، وتغذيتها لنماذجهم المفتوحة المصدر للتدريب المعزز. هذا يعادل استخدام الإجابات القياسية التي أنفقت المختبرات الأمريكية مبالغ طائلة لاستخراجها كملاحظات صغيرة، لتحقيق أداء قريب بتكلفة منخفضة جدًا.

موقف ساكس من هذا حاد، ينتقد داريو من Anthropic الذي دفع الحكومة الأمريكية لوضع إجراءات أمنية معقدة للموافقة، مما أدى إلى إبطاء وتيرة أمريكا نفسها. نموذج Fable تم إزالته قسرًا بسبب اتهامات الاختراق، كما أن الموافقة على نموذج OpenAI الجديد صعبة. استنتاجه هو أن النماذج الصينية متأخرة تقنيًا بحوالي 9 أشهر، ومتأخرة في الرقائق بحوالي 24 شهرًا، لكنها بالفعل دربت عائلة GLM5 بالكامل على الرقائق المحلية مثل Huawei Ascend. في المستقبل، من المحتمل أن تُغرق هذه "الصناديق الذكاء الاصطناعي" المحسّنة للرقائق المحلية والرخيصة الاستخدام السوق العالمية بأسعار منخفضة، بينما تضع أمريكا قيودًا مختلفة، مما يُضيع سوق تصدير تريليون دولار.

بالنسبة لتقرير ميكرون الأخير، قدم البرنامج تحديدًا دقيقًا: DRAM هي العقدة الحقيقية التي تختنق بها موجة الذكاء الاصطناعي بأكملها.

إيرادات ميكرون هذا الربع قفزت أربعة أضعاف سنويًا، من 9 مليارات إلى 42 مليارًا، وتوقعاتها تجاوزت التوقعات بكثير، وقد بيعت بالكامل سعة HBM لعام 2026.

هناك وجهة نظر مباشرة في البرنامج: سابقًا، كان الناس يبحثون عن شركات صغيرة للسلع المساعدة في تويتر كأسهم "اختناق"، لكن العصب الحقيقي هو DRAM فقط، وخاصة HBM. السبب بسيط: عرض النطاق الترددي للذاكرة وسعتها يحددان السقف المادي لأداء الاستدلال لجميع النماذج الكبيرة، وهذا قيد صعب لا يمكن تجاوزه. حتى أنهم ذكروا أن المصنع العملاق الذي يبنيه ماسك يركز تقنيًا على DRAM، وليس على الألياف الضوئية أو مصدر الطاقة أو ذاكرة NAND.

هذه المرة، قامت ميكرون أيضًا بتغيير مثير في نموذج أعمالها: توقيع اتفاقيات توريد طويلة الأمد مع مزودي الخدمات السحابية الأساسيين، تتضمن حماية "سعر أدنى وأعلى"، مما يغلق 50% من الإيرادات المستقبلية. هذا يعني أنه حتى لو انخفضت دورة الصناعة مستقبلاً، فإن السعر الأدنى التعاقدي سيكون أعلى من ذروة الهامش الإجمالي لأي دورة سابقة.

فيما يتعلق بحواجز الدخول، على الرغم من أن Changxin Memory الصينية تستعد للإدراج، وقد تخفف في المستقبل ضغط التكاليف على شركات كبيرة مثل Apple بذاكرة استهلاكية منخفضة السعر متوسطة المستوى، لكن في مجال HBM الراقي اللازم لخوادم الذكاء الاصطناعي، لا يزال عالميًا فقط ثلاث شركات قادرة على الإنتاج: ميكرون، SK Hynix، Samsung. العملية صعبة للغاية ولا يمكن للحاق بها على المدى القصير.

البرنامج أعطى توقعًا مبالغًا فيه بعض الشيء: في العام المقبل، سيتجه 30% إلى 40% من الإنفاق الرأسمالي العالمي فائق الحجم مباشرة إلى شركات رقائق DRAM. هذا الارتفاع في التكاليف أدى بالفعل إلى رفع أسعار التجزئة لـ MacBook و Mac Studio من Apple بالكامل.

جزء الحوسبة الطرفية والتوزيع الموزع هو المحتوى الأكثر إبداعًا في هذه الحلقة، سأشارك بعض الأفكار التي أعتقد أنها مثيرة للاهتمام.

تقدمت Tesla في 18 يونيو بطلب علامة تجارية للأجهزة تسمى "Megapod". المنطق الفيزيائي وراء ذلك هو: بناء مركز بيانات بقدرة 1 جيجاوات على الأرض يتطلب إجراءات موافقة طويلة جدًا على الأرض والطاقة والتبريد السائل. فكرة Megapod هي دمج وحدات GPU وشبكات البطاريات وأنظمة التبريد في مركز بيانات معياري يشبه الحاوية، يُنقل مباشرة إلى شبكة محطات الشحن الفائقة التابعة لـ Tesla التي تمت الموافقة عليها بالفعل ولديها شبكات كهرباء جاهزة وأراضٍ فارغة، متجاوزًا أكبر عقبة في بناء مراكز البيانات التقليدية: الموافقة والوصول إلى الطاقة.

منطق خط التوزيع الموزع مثير للاهتمام أيضًا: يمكن تقسيم إجابة النموذج على سؤال إلى مرحلتين: مرحلة Prefill لفهم السؤال، ومرحلة Decode عالية النطاق الترددي وتستهلك الكثير من الذاكرة. يمكن لرأس المال الكبير شراء بطاقات الرسومات القديمة المستهلكة، وربطها خارجيًا برقائق مخصصة لتحسين فك التشفير، لتشكيل شبكة توزيع موزع منخفضة التكلفة.

فكرة أكثر جنونًا: تقديم خصومات للمستخدمين الذين يشترون بطاريات تخزين الطاقة المنزلية Powerwall، وإجبار تضمين شريحة ذكاء اصطناعي في كل بطارية، مع اتصال عبر Starlink، وعندما تكون البطاريات خاملة، تتشكل تلقائيًا مجموعة ضخمة موزعة من P2P للاستدلال، مما يوفر طاقة حاسوبية خارجية شبه مجانية ومستمرة. إذا تحقق هذا الاقتراح، سيكون ضربة مدمرة لشركات الحوسبة السحابية التقليدية.

الجزء الأكثر جنونًا هو الحوسبة الفضائية. بناء مركز بيانات بقدرة 1 جيجاوات على الأرض يتطلب 35 مليار دولار لتكلفة الرقائق و 25 مليار دولار لتكلفة التبريد والعمالة، بالإضافة إلى نزاعات استخدام الأراضي المختلفة. لكن مع تحقيق SpaceX لصاروخ Starship القابل لإعادة الاستخدام بالكامل، قد تنخفض تكلفة إرسال طاقة حاسوبية بقدرة 1 جيجاوات إلى المدار الفضائي عبر ربط ليزري إلى 5 مليارات دولار فقط. البيئة شديدة البرودة في الفضاء والطاقة الشمسية اللامحدودة تقريبًا قد تجعل اقتصاديات تشغيل مراكز البيانات الفضائية تتفوق على مراكز البيانات الأرضية خلال 3 إلى 4 سنوات.
DRAM%4.91-
SKHYNIX%8.97-
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت