كلما أصبح الذكاء الاصطناعي أرخص، أصبحت الرقائق أغلى.

في 30 يونيو، أصدرت Anthropic نموذج Claude Sonnet 5.

هذا نموذج متوسط المستوى، وهو "الأكثر قدرة على العمل" في سلسلة Sonnet. حقق 63.2 نقطة في اختبار SWE-bench Pro لقياس القدرات الوكيلة - بفارق 6 نقاط فقط عن النموذج الرائد Opus 4.8 الذي سجل 69.2 نقطة. على الصعيد الآخر، في اختبار التفكير على مستوى الخريجين GPQA-AAA v2، تفوق Sonnet 5 على Opus 4.8.

التسعير أكثر أهمية. خلال فترة الخصم، تبلغ تكلفة كل مليون رمز إدخال 2 دولارًا، والإخراج 10 دولارات. السعر المقابل لـ Opus 4.8 هو 5 دولارات و 25 دولارًا - Sonnet 5، بأربعة إلى ستة أعشار السعر، يحقق أكثر من 90٪ من قدرات النموذج الرائد.

يمكن قراءة هذا الخبر بطريقتين.

الأولى: الذكاء الاصطناعي أصبح أرخص مرة أخرى. انخفاض التكاليف يفيد الجميع، وتستمر حرب Chatbot، وتتنافس شركات النماذج بشراسة.

الثانية - وهي التي يسعرها السوق حاليًا - كلما كان النموذج أرخص، كانت قوة الحوسبة والتخزين أغلى.

في يوم إصدار Claude Sonnet 5، ارتفع مؤشر أشباه الموصلات الأمريكي بنحو 4٪. هناك خيط واضح في قصة الذكاء الاصطناعي على مدى السنوات الثلاث الماضية: كفاءة الاستدلال ستقضي على الطلب على الرقائق. لكن هذا الحكم كان خاطئًا في كل نقطة بيانات.

انخفاض السعر: ألف مرة في ثلاث سنوات

انظر أولاً إلى خط انخفاض السعر.

في عام 2022، كانت تكلفة استدعاء واجهة برمجة التطبيقات بمستوى GPT-4 حوالي 0.03 دولار لكل ألف رمز. بحلول عام 2025، انخفض سعر النماذج بنفس مستوى الأداء - وفقًا لتقرير مؤشر الذكاء الاصطناعي بجامعة ستانفورد - بحوالي 280 مرة. مع التأثير المشترك للمصادر المفتوحة وتحسين الكفاءة، يبلغ الانخفاض المقبول على نطاق الصناعة 1000 مرة.

لم ينخفض سعر نموذج واحد فقط، بل انخفض سعر كل نموذج.

هذه المرة، يتوافق Sonnet 5 من Anthropic مع كثافة قدرات Opus 4.8، بسعر يتراوح بين أربعة إلى ستة أعشار. تبلغ تكلفة إنشاء الفيديو Omni Flash من Google 0.10 دولارًا في الثانية، وينتج نموذج الصور Nano Banana 2 Lite صورة في 4 ثوانٍ، وتبلغ تكلفة كل ألف صورة 0.034 دولارًا - نصف سعر الجيل السابق. يخفض DeepSeek-V4-Pro تكلفة إدخال مليون رمز إلى 0.035 دولارًا.

لا يقتصر انخفاض السعر على قائمة الأسعار فحسب.

في 24 يونيو، ذكرت The Information أن OpenAI وجدت تقنية تحسين برمجية خالصة داخليًا - حيث تم تقليل متطلبات وحدة معالجة الرسومات لمرحلة معينة من العمليات الحسابية بأكثر من النصف، وانخفض تجمع وحدات معالجة الرسومات المخصصة من عدة آلاف إلى بضع مئات. في نفس الشهر، اقترحت Meta خطة Vistara: إعادة توصيل ذاكرة DDR4 من الخوادم المتقاعدة عبر شريحة CXL ذاتية التطوير، ودمجها مع DDR5 بنسبة 3:1، مما يخفض تكلفة خادم الاستدلال بنسبة 25٪.

بحلول 30 يونيو، أصدرت خطوة (شركة) تقنية JetSpec لفك التشفير التخميني - يمكن زيادة سرعة استدلال النماذج الكبيرة بمقدار 10 أضعاف تقريبًا. وهذا يعني، بالنسبة لنفس كمية إخراج الرموز، يمكن تقليل عدد وحدات معالجة الرسومات المطلوبة بمقدار عشرة أضعاف.

إذا كان الذكاء الاصطناعي دالة تقليدية للتكلفة والطلب، فإن هذه الإشارات يجب أن تشير إلى شيء واحد: الحاجة إلى عدد أقل من الرقائق في المستقبل.

هذا ما كان يخشاه وول ستريت.

في عطلة نهاية الأسبوع التي أصدرت فيها DeepSeek نموذج R1 في يناير، شهدت أسهم البنية التحتية للذكاء الاصطناعي أعلى موجة بيع عنيفة في السنوات الأخيرة. انهار سهم شركة السحابة AI Nebius بنسبة 40٪. القصة بسيطة: نموذج صيني مفتوح المصدر يبيع الرموز بمبلغ 0.1 دولار، بينما تنفق الشركات الأمريكية 2 دولار، وبالتالي لا بد أن ينهار الطلب على قوة الحوسبة.

الانفجار: إجمالي الإنفاق ارتفع بنسبة 320٪ بدلاً من ذلك

لكن ما حدث بالفعل كان عكس ذلك تمامًا.

يتذكر رومان تشيرنين، المؤسس المشارك لـ Nebius، لاحقًا: الأسبوع الذي تسبب فيه DeepSeek في حالة من الذعر "ربما كان أفضل أسبوع مبيعات لدينا". عندما رأت أقسام المشتريات في الشركات الانخفاض المفاجئ في التكاليف، لم يكن رد فعلها الأول خفض الميزانية، بل أخيرًا يمكنها تشغيل الاستدلال على نطاق واسع.

في عام 2024، بلغ إجمالي الإنفاق العالمي للشركات على الذكاء الاصطناعي التوليدي حوالي 11.5 مليار دولار. في عام 2025، ارتفع هذا الرقم إلى 37 مليار دولار - بزيادة قدرها 320٪ في عام واحد. وفقًا لاستطلاع Menlo Ventures للشركات، كان متوسط عدد تطبيقات الذكاء الاصطناعي التي تديرها الشركة في عام 2025 "عشرات"، بينما كان هذا الرقم في عام 2023 من 1 إلى 2.

جميع البيانات على جميع الأبعاد تقع على نفس المنحنى:

في أبريل 2026، كانت Uber قد استنفدت بالفعل ميزانية الذكاء الاصطناعي السنوية بأكملها. تتعامل AT&T حاليًا مع 27 مليار رمز يوميًا - قبل 18 شهرًا، كان هذا الرقم 800 مليون. شركة تأمين صحي أمريكية كبيرة، قفز استهلاكها الشهري للرموز من 3 ملايين فجأة إلى أكثر من 150 مليونًا.

عند تفكيكها، يأتي النمو من تراكم ثلاثة اتجاهات.

الأول هو انتشار التطبيقات. قسم التسويق في كل شركة يستخدم 3 أدوات ذكاء اصطناعي، قسم المبيعات 4، قسم خدمة العملاء 2، بالإضافة إلى الشؤون القانونية والموارد البشرية والمالية - من 2 إلى عشرات، هذه قفزة هائلة في الكمية.

الثاني هو عمق التطبيق الواحد. خذ ذكاء اصطناعي لخدمة العملاء كمثال: في عام 2023، كان متوسط التفاعل اليومي حوالي 500 مرة، كل مرة حوالي 800 رمز، وينتهي بعد المحادثة. بحلول عام 2025، أصبح التفاعل اليومي 15000 مرة، كل مرة حوالي 4500 رمز، ويؤدي كل تفاعل إلى 3 إلى 5 استدلالات لاحقة - تحليل المشاعر، توقع التصعيد، تقييم الجودة - كلها متراكمة على نفس المدخل.

الثالث هو التعقيد المتزايد للنموذج نفسه. من نموذج أحادي الجولة بمعاملات 7B، الترقية إلى وكيل استدلال متعدد الخطوات بأكثر من 70B، حيث يستهلك الاستدلال الداخلي لكل جولة عشرات إلى مئات أضعاف الرموز مقارنة بالتفاعل الخطي.

بعبارة أخرى، انخفضت تكلفة الرمز إلى جزء من الألف، لكن عدد الرموز المستخدمة في السوق زاد بعشرات الآلاف من المرات. التأثير الصافي للضرب هو اتجاه واحد فقط: انفجار الإنفاق.

يتضاعف استهلاك الرمز كل شهرين - عدة خطوط مستقلة تتقارب على نفس الرقم. إذا رسمنا هذا المنحنى الأسي حتى عام 2027، فإن تجاوز الإنفاق السنوي على الذكاء الاصطناعي للشركات لمليار دولار هو مسألة حسابية، وليست مسألة تنبؤ.

الانتقال: التخزين ارتفع ستة أضعاف، البنية التحتية للرقائق تشير إلى 7.6 تريليون

الطلب المحفز بانخفاض الأسعار لم يبق في طبقة البرمجيات.

الزيادة في أسعار الذاكرة هي الإشارة الأكثر مباشرة لانتقال طلب الذكاء الاصطناعي من طبقة النموذج إلى طبقة الأجهزة.

اعتبارًا من الربع الثالث من عام 2025، تجاوزت الزيادة التراكمية في الأسعار الفورية لـ DRAM و NAND Flash 300٪. في شهر واحد، تجاوزت الزيادة في رقائق DDR5 90٪. عند دخول عام 2026، لم تتوقف الزيادات فحسب، بل تسارعت.

في الربع الأول، تم تعديل الزيادة المتوقعة في أسعار عقود DRAM من 55٪ -60٪ إلى 90٪ -95٪؛ و NAND من 33٪ -38٪ إلى 55٪ -60٪. توقعات TrendForce للربع الثاني هي زيادة DRAM بنسبة 58٪ -63٪، و NAND بنسبة 70٪ -75٪.

بالارتكاز على المنتجات الاستهلاكية: مجموعة ذاكرة Acer Predator DDR5 32G 6000، كان سعرها في نهاية أكتوبر 2025 حوالي 1300 يوان، وبحلول يناير 2026 ارتفع إلى 2700 يوان. تضاعف في ثلاثة أشهر، وهو أمر نادر جدًا في سوق السلع الاستهلاكية.

سجلت أعمال الذاكرة لشركة Samsung أرباحًا تشغيلية فصلية قياسية في الربع الرابع من عام 2025 - متجاوزة 20 تريليون وون كوري، أي حوالي 96.2 مليار يوان صيني. وأقوى دافع لهذا الارتفاع على مدى أكثر من عام لم يأت من الترقية الاستهلاكية للهواتف المحمولة أو أجهزة الكمبيوتر، بل من المشتريات الهائلة من مراكز بيانات الذكاء الاصطناعي لـ HBM و SSD للمؤسسات و DRAM عالية الكثافة.

قام تقرير صادر عن Goldman Sachs في مايو بحساب هذه الفاتورة إلى أقصى حد.

يتوقع التقرير أن يصل إجمالي الإنفاق الرأسمالي التراكمي على البنية التحتية للذكاء الاصطناعي على مستوى العالم بين عامي 2026 و 2031 إلى حوالي 7.6 تريليون دولار. 765 مليار دولار في عام 2026 وحده، لترتفع إلى 1.6 تريليون بحلول عام 2031. من بينها، تبلغ تكلفة وحدة معالجة رسومات الأساسية الواحدة (استنادًا إلى NVIDIA VR200 Rubin) 80,500 دولار، وتمثل NVIDIA 75٪ من إجمالي إنفاق قوة الحوسبة في كل فترة.

طرح Goldman Sachs أيضًا سؤالًا رئيسيًا في التقرير: إذا تم استبدال وحدات معالجة الرسومات على نطاق واسع بواسطة ASIC (دوائر متكاملة خاصة بالتطبيق)، فهل يمكن تقليل الطلب الإجمالي؟

الجواب يعتمد على الحالة. إذا كان الطلب غير مرن - طلب الشركات على قوة الحوسبة للذكاء الاصطناعي ثابت - يمكن أن يؤدي استبدال ASIC مباشرة إلى تقليل إجمالي متطلبات رأس المال. ولكن إذا كان الطلب مرنًا - كلما كانت قوة الحوسبة أرخص، زاد الشراء - فإن تغيير مزيج الرقائق يعيد بشكل أساسي توزيع الأرباح بين الموردين المختلفين، وليس حجم الإنفاق الإجمالي.

السيناريو الأساسي لـ Goldman Sachs هو الثاني.

تتجه أسعار الأسهم الأمريكية أيضًا في نفس الاتجاه. ارتفعت أسهم SanDisk بنسبة 857٪ منذ بداية العام، وفي تقرير صادر في 30 يونيو، رفعت Bernstein السعر المستهدف إلى 3000 دولار. ارتفعت AMD بنسبة 7٪ في يوم واحد إلى أعلى مستوى تاريخي. الشركات المصنعة لوحدات معالجة الرسومات والذاكرة والتغليف ومعدات مراكز البيانات - كلها عند أو بالقرب من أعلى مستوياتها.

الرقم الأكثر تأثيرًا استشهد به مقال مراجعة من Edgen.tech في 11 يونيو: ارتفعت أسعار رقائق الذاكرة ستة أضعاف في العام الماضي.

لا يمكن لصق تسمية "الانتعاش الدوري". الشيء الذي ارتفع ستة أضعاف، خلفه إعادة تسعير الطلب من النظام الاقتصادي بأكمله للبنية التحتية المادية للذكاء الاصطناعي.

الجذر: Jevons أجاب عليه بالفعل في عام 1865

كتب ويليام ستانلي جيفونز في عام 1865 كتابًا بعنوان "مشكلة الفحم".

ملاحظته الأساسية: بعد أن قام وات بتحسين المحرك البخاري، انخفض استهلاك الفحم لكل وحدة بشكل كبير، لكن إجمالي استهلاك الفحم في بريطانيا لم ينخفض بل زاد. لأن تحسين الكفاءة جعل الطاقة البخارية مقبولة التكلفة في المزيد من الصناعات - النسيج والسكك الحديدية والتعدين والشحن - كل سيناريو جديد خلق طلبًا على الفحم لم يكن موجودًا من قبل.

بعد 160 عامًا، تتكرر نفس المعادلة في قوة الحوسبة للذكاء الاصطناعي.

قامت الشركات بالحسابات. بسعر الرمز في عام 2022، لم تكن محادثات خدمة العملاء في الوقت الفعلي مع الاستدلال مجدية اقتصاديًا. السيناريوهات غير العاجلة لا تستحق تشغيل الذكاء الاصطناعي. يمكن فقط إنشاء محتوى مخصص على مستوى المجموعة الفرعية، وليس على مستوى المستخدم. بحلول عام 2025، انخفض السعر 1000 مرة، وأصبحت هذه "الاحتياجات غير الموجودة سابقًا" كلها احتياجات أساسية.

قدم تشيرنين من Nebius أقصر ملخص: "في كل مرة نجعل فيها نفس وحدة الذكاء أرخص، فإننا لا نقلل الاستهلاك، بل نزيده - لأن نفس الميزانية يمكنها حل مهام أكثر تعقيدًا."

تجاهل السوق قوة هيكلية أخرى: حلقة التغذية الراجعة الإيجابية للهامش الإجمالي.

منحنى الهامش الإجمالي للاستدلال بالذكاء الاصطناعي ليس له نظير في التاريخ. قد يكون الهامش الإجمالي لشركة تقدم واجهة برمجة تطبيقات في مرحلة البداية 10٪ فقط - تدريب النموذج مكلف، والاستدلال مكلف. لكن تحسينات البرمجيات (دمج العوامل، القياس الكمي، فك التشفير التخميني) تضغط على تكاليف الاستدلال كل شهر، بينما يتأخر تعديل الأسعار دائمًا. وبالتالي، فإن سرعة ارتفاع الهامش الإجمالي من 10٪ إلى 90٪ أقصر من أي صناعة تقليدية.

الهامش الإجمالي يدفع الربح، والربح يدفع المزيد من المشتريات، والمشتريات توزع التكاليف - حلقة تغذية راجعة إيجابية، بدون سقف.

"إذا كان لديك DRAM، يمكنك بيع الرموز؛ إذا لم يكن لديك DRAM، لا يمكنك بيع الرموز." هذه الجملة أصبحت المعادلة الأساسية للطلب على رقائق الذكاء الاصطناعي.

افتراضا الحساسية في تقرير Goldman Sachs يعززان نفس الحكم. إذا انخفض العمر الاقتصادي للرقاقة من 5 سنوات إلى 3 سنوات، يتسارع دورة الاستبدال، ويرتفع الطلب الرأسمالي التراكمي مباشرة. إذا كانت الذاكرة لكل شريحة أعلى بنسبة 25٪ مما كان متوقعًا - فهذا يغير بشكل أساسي توزيع الإنفاق داخل كومة الرقائق، وتأثيره الصافي على إجمالي 7.6 تريليون محدود، لكن الاتجاه هو نفسه: لن يتم إنفاق أموال أقل.

النهاية: من يمسك بقوة الحوسبة

رفع الحظر التصديري لـ Fable 5 - حظر في 12 يونيو، ورفع في 30 يونيو، ثلاثة أسابيع فقط - قدم حاشية غير متوقعة لهذه المفارقة.

سبب الحظر هو "مخاطر الأمن القومي". رفع الحظر لا علاقة له باختفاء المخاطر - ظهر بديل. خلال فترة الحظر، أطلقت فرق آسيوية مثل Tulongfeng نماذج قريبة من مستوى Mythos، وسرعان ما تلاشت قوة الردع للحظر. رفع الحظر هو نتيجة للواقع، ولا علاقة له بحسن النية.

تقع هذه الحلقة بالضبط على الخط الرئيسي لمفارقة خفض تكلفة الذكاء الاصطناعي: النماذج قابلة للاستبدال. من GPT إلى Claude إلى DeepSeek إلى النماذج مفتوحة المصدر، لا يمكن لأحد احتكار قدرات الذكاء الاصطناعي نفسها - من يضع حاجزًا، سيجد آخر طريقًا للالتفاف.

الأجهزة ليست بهذا المنطق.

وحدات معالجة الرسومات ليست كذلك. DRAM ليست كذلك. دورة بناء مصنع الرقاقات تقاس بالسنوات. الطاقة الإنتاجية لأجهزة الطباعة الحجرية ثابتة. مرونة العرض للسيليكون عالي النقاء تقترب من الصفر. هذه كلها قوانين فيزيائية، وليست استراتيجيات تجارية. يمكن لتحسين البرمجيات ضغط تكلفة النموذج ألف مرة، لكن لا يمكن ضغط يوم واحد من دورة بناء مصنع الرقاقات.

نقطة نهاية انخفاض أسعار نماذج الذكاء الاصطناعي، إذا استمرت هذه المفارقة في العمل، لا تشير إلى إزالة قوة الحوسبة - بل إلى إعادة تركيز سلطة تسعير قوة الحوسبة. بغض النظر عن النموذج الذي تستخدمه، يجب أن تعمل الرموز على شريحة شخص ما. كل قرش تخفضه شركات النماذج من الأسعار يتحول في النهاية إلى إيرادات في دفاتر مراكز البيانات ومصانع الرقاقات وخطوط إنتاج التخزين. كلما كان خفض التكلفة أكثر عنفًا، كان هذا التحول أكثر لا رجعة فيه.

بيان المخاطر وشروط الإخلاء

        السوق ينطوي على مخاطر، ويجب توخي الحذر عند الاستثمار. لا تشكل هذه المقالة نصيحة استثمارية شخصية، كما أنها لا تأخذ في الاعتبار أهداف الاستثمار الخاصة أو الوضع المالي أو احتياجات المستخدمين الفرديين. يجب على المستخدمين النظر فيما إذا كانت أي آراء أو وجهات نظر أو استنتاجات في هذه المقالة تتوافق مع وضعهم الخاص. الاستثمار بناءً على ذلك هو على مسؤولية المستخدم الخاصة.
DRAM%2.31
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت