لماذا أصبحت أسعار وحدات معالجة الرسومات (GPU) تتجه نحو الارتفاع بشكل غير متوقع؟

العنوان الأصلي: The Great GPU Shortage – Rental Capacity – Launching our H100 1 Year Rental Price Index
المؤلف الأصلي: Daniel Nishball、Jordan Nanos、Cheang Kang Wen 等编译:Peggy,BlockBeats

المؤلف الأصلي:律动BlockBeats

المصدر الأصلي:

إعادة النشر: 火星财经

ملاحظة المحرر: مع انتقال الذكاء الاصطناعي من كونه «أداة» إلى «بنية تحتية لخطوط العمل»، تدخل أسعار إيجار وحدات GPU في نطاق صعود متسارع، بينما تستمر الإمدادات في التضيق.

من ارتفاع سعر عقد إيجار H100 لمدة سنة بنحو 40%، إلى حجز قدرات الحوسبة مسبقًا حتى النصف الثاني من 2026، ثم إلى استمرار حجز الإمدادات عبر العقود طويلة الأجل وآليات التجديد من خلال مختبرات الذكاء الاصطناعي، فقد تغيّرت منطقيات تشغيل سوق GPU بشكل واضح: لم تعد الأسعار تُحدد بشكل رئيسي بتكلفة العتاد، بل يتم تشكيلها معًا بواسطة استهلاك token وقدرات النماذج وكفاءة الإنتاج.

إن تغيّرات جانب الطلب هي الأكثر أهمية. تعمل النماذج/الأنماط الجديدة مثل أنظمة متعدد الوكلاء، والتوليد الأصلي للمحتوى، وأدوات برمجة الذكاء الاصطناعي، على دفع استخدام token إلى نطاق نمو أسي. كما أصبحت الاستنتاجات الأساسية للتقرير أكثر وضوحًا تدريجيًا: لقد تم التحقق من أن نسبة العائد إلى التكلفة لاستثمارات أدوات الذكاء الاصطناعي قد أصبحت فعّالة—عائدات بمقدار 5–10 أضعاف—وهو ما يجعل أسعار الحوسبة صعبة على فرض قيود فعّالة على الطلب خلال مدة طويلة نسبيًا.

تتشكل التوترات الناتجة بشكل أكثر وضوحًا: في الواقع، يظهر سوق الحوسبة بظاهرة نقص شامل وانتقال سلطة التسعير إلى الأعلى، بينما لا تزال الأسواق الرأسمالية تراهن على توقع «ستصبح فائضة في النهاية وستتحول إلى سلعة». إن عدم التطابق بين هذا التوقع والواقع يعيد تشكيل منطق تقييم مسار البنية التحتية للذكاء الاصطناعي.

عندما تصبح الحوسبة مادة إنتاج جديدة، فإن آلية تسعيرها وبنية العرض وعائد رأس المال تمر جميعها بمرحلة إعادة هيكلة عميقة.

فيما يلي نص المقال الأصلي:

شهد طلب كبيرًا الارتفاع على Claude 4.6 Opus وClaude Code من Anthropic. خلال ربع واحد فقط، قفزت إيراداتها السنوية المتكررة (ARR) من أواخر العام الماضي—أي 9 مليارات دولار—إلى ما يزيد حاليًا عن 25 مليار دولار، محققة تقريبًا نموًا بثلاثة أضعاف. وفي الوقت نفسه، تدفع النماذج مفتوحة المصدر، التي تمثلها GLM وKimi K2.5، أيضًا إلى التوسع السريع في سيناريوهات تطبيقات النماذج مفتوحة المصدر. وتواصل الشركات، بما في ذلك Anthropic وOpenAI، إلى جانب عدة جهات ضمن Neolabs، جمع التمويل بشكل مستمر، ما يزيد من حدة الطلب على موارد GPU.

تعني هذه نقطة التحول أن الطلب ارتفع بشكل حاد خلال فترة قصيرة؛ وقد ظهرت موجة حجز مسبق على GPU لدى عمالقة السحابة فائقة الحجم (hyperscalers) ومقدمي خدمات سحابة ناشئين (Neoclouds).

يدفع هذا الطلب الجديد الأسعار إلى الأعلى عبر سلسلة التوريد بالكامل—من وحدات DRAM وNAND التخزينية، إلى الكابلات الليفية والبنية التحتية لاستضافة مراكز البيانات، وصولًا إلى توربينات الغاز وغيرها من البنى التحتية—وتشهد تقريبًا كل المنتجات والخدمات ذات الصلة ارتفاعًا.

لقد أصبحت أسعار إيجار GPU المجال الأحدث ضمن عدد كبير من منتجات وخدمات الحوسبة الذي ظهرت فيه فجأة حالة نقص في الإمدادات وقفزة في الأسعار. ارتفعت أسعار عقود إيجار GPU لمدة سنة لـ H100 من أدنى مستوى في أكتوبر 2025—1.70 دولار للساعة لكل GPU—إلى 2.35 دولار في مارس 2026، بزيادة تقارب 40%.

لقد نفدت سعات إيجار GPU حسب الطلب (on-demand) تقريبًا بالكامل في جميع الطرازات—فالمستخدمون الذين حجزوا سلفًا مثيلات حسب الطلب، حتى بعد ارتفاع الأسعار، لا يزالون لا يرغبون في إعادة الحوسبة إلى السوق. في مطلع 2026، صارت صعوبة العثور على قدرات GPU شبيهة بمحاولة الحصول على «آخر رحلة» من تذاكر الطيران: الأسعار مرتفعة جدًا، وعمليًا لا توجد تذاكر. وباستعارة أدق، بدلًا من كونها مسألة «حجز تذاكر»، فهي أقرب إلى «البحث عن قنوات لشراء الدواء».

في SemiAnalysis، نتابع على مدى فترة طويلة مختلف الاتجاهات والقضايا الرئيسية داخل منظومة Neocloud والسحابة فائقة الحجم، ومن ضمن ذلك أسعار إيجار GPU. تأتي هذه القدرة من بحثنا وممارساتنا المستمرة في مشاريع مثل ClusterMAX وInferenceX وAI Cloud إجمالي تكلفة الملكية (TCO).

وفي الوقت نفسه، بذلنا أيضًا قدرًا كبيرًا من الجهد لمساعدة مختلف مختبرات الذكاء الاصطناعي على التواصل مع مزودي خدمات Neocloud للعثور في السوق على موارد إيجار GPU، مع الاستمرار في تبادل الحديث مع جميع الأطراف تقريبًا في المنظومة حول اتجاهات التغير في أسعار إيجار GPU.

منذ عام 2023، أنشأنا وصنّعنا للعميل مجموعة من مؤشرات أسعار إيجار GPU والمحافظة عليها، تغطي الطرازات الرئيسية من GPU (مثل H100 وH200 وB200 وB300 وGB200 وGB300 وMI300 وMI325 وMI355)، وتمتد عبر مدد إيجار مختلفة—من حسب الطلب (on-demand)، إلى إيجار قصير لمدة شهر، وصولًا إلى أطول عقود طويلة تصل إلى 5 سنوات. يُبنى هذا المؤشر اعتمادًا على بيانات الاستطلاع من عدة مزودي خدمات Neocloud ومشترين للقدرة الحوسبية، ويتم التحقق المتقاطع عبر بيانات المعاملات الفعلية، وكذلك عبر مفاوضات ونتائج صفقات شاركنا في التوسط فيها.

اليوم، نفتح مؤشر أسعار إيجار H100 لمدة سنة أمام الجمهور، بهدف تزويد الصناعة بمزيد من البيانات والأفكار. يتم تحديث هذا المؤشر شهريًا، وسنواصل نشر أحدث قراءات الاتجاهات وملاحظات السوق عبر X وLinkedIn. أما بالنسبة للبيانات الكاملة للتسعير التي تغطي بنى مدد الإيجار المختلفة وغيرها من طرازات GPU الرئيسية، فهي متاحة حاليًا فقط للمستخدمين المؤسسيين الذين يشتركون في نموذج AI Cloud TCO الخاص بنا.

سيركز هذا التقرير على أحدث اتجاهات سوق إيجار GPU وملاحظات السوق من الخط الأمامي والبيانات الرئيسية، مع شرح كيف نفهم بنية السوق ككل، وتقديم تقدير أولي لاتجاه أسعار الإيجار في المستقبل.

يدخل سوق إيجار GPU مرحلة «التسعير الديناميكي»

فقط من منحنى أسعار إيجار H100 لمدة سنة وحده، لا يكفي لإظهار مدى شدة التوتر في السوق بالكامل—فالخبرة الفعلية في الحصول على قدرات الحوسبة من الخط الأمامي، بالإضافة إلى ردود المشاركين في السوق، تعكس وضعًا أكثر حدة.

ينبع الطلب الحالي من عدة سيناريوهات استخدام شديدة التباين من حيث الخصائص، ولا يوجد تقريبًا «حل عام». على سبيل المثال، في جانب الاستدلال (inference)، تعد النماذج الكبيرة لمزيج الخبراء (MoE) أكثر ملاءمة للتشغيل على الأنظمة الكبيرة الأحدث مثل GB300 NVL72؛ أما في جانب التدريب (training)، فما زالت H100 تتمتع بميزة من ناحية القيمة مقابل السعر، ما يجعل الطلب يظل مرتفعًا حتى على وحدات GPU الخاصة بـ «الجيل الأقدم» نسبيًا.

حتى أن بعض العملاء صاروا يتنافسون على دفع 14 دولارًا للساعة لكل GPU مقابل سعر مثيلات AWS p6-b200 الاستباقية (抢占式). ولم يعد بعض مزودي Neocloud الرئيسيين يبيعون وحدات عقدة واحدة؛ كما أن أسعار تجديد بعض عقود H100 هي نفسها تمامًا كما كانت عند التوقيع قبل سنتين إلى ثلاث سنوات. وهناك أيضًا عقود H100 جُددت مباشرة حتى عام 2028، لتصل مدة الإيجار إلى 4 سنوات. والآن، الرغبة في الحصول حتى على 8 عقد (64 بطاقة GPU) من عنقود H100 أو H200 ليست سهلة—فمن بين المزودين الذين سألناهم، كان نصفهم قد نفد تمامًا، أما رد أغلب المزودين فكان: لا توجد أي وحدة GPU بمعمارية Hopper ستنتهي عقودها قريبًا وتتحرر.

حتى إننا سمعنا أن بعض مستأجري قدرات الحوسبة بدأوا تفكيك العناقيد التي استأجروها وإعادة تأجيرها مرة أخرى، وكأنهم يفعلون ذلك مثل تفكيك شقة لتأجير قصير خلال سباق موناكو للجائزة الكبرى. ومن غير المرجح أن يبقى «Neocloud ثانٍ (two landlord)» مجرد مزحة بعد الآن.

إن إمداد Blackwell شديد الندرة كذلك. علمنا أنه بسبب قوة الطلب على نماذج أوزان مفتوحة المصدر، وبسبب استمرار انفجار الطلب في جانب الاستدلال، فقد طال أمد دورة نشر وتسليم عناقيد Blackwell الجديدة من 6 إلى 7 أشهر. علاوة على ذلك، فإن معظم العناقيد التي ستُطرح قريبًا تكون قد تم حجزها مسبقًا. وبالفعل، ومن منظور السوق ككل، فإن القدرة الإضافية التي ستُطرح بين أغسطس وسبتمبر 2026 فقط تقريبًا تكون كلها قد حُجزت بالكامل.

أسعار إيجار GPU: عودة صاخبة

لكن لماذا وصلت السوق إلى هذه المرحلة؟ قبل 6 أشهر، كان معظم مراقبي السوق يشككون في «القيمة النهائية» لـ GPU، وكان الاعتقاد السائد أن أسعار إيجار GPU ستظل تنخفض حتمًا مع مرور الوقت. في ذلك الوقت، إذا استخدم Neocloud أو عمالقة السحابة فائقة الحجم دورات إهلاك مدتها 6 سنوات لمعالجة أصول قدرات الحوسبة GPU في نماذجهم المالية، فربما كانوا سيواجهون انتقادات من محللين ماليين. وقبل مناقشة الاتجاهات المستقبلية، دعونا نراجع بسرعة كيف تطورت الأمور حتى هذه النقطة.

قبل النصف الثاني من 2025، كانت التوقعات السائدة في المنظومة كلها: مع نشر Blackwell على نطاق واسع، وبسبب انخفاض تكلفة وحدة الحوسبة بشكل ملحوظ، فإن أسعار إيجار Hopper (أي H100 وH200) ستعود للهبوط بشكل واضح. لكن الواقع كان عكس ذلك تمامًا. في النصف الثاني من 2025، لم يضعف الطلب على H100—بل ازداد في العديد من السيناريوهات. إن الانتشار السريع للنماذج ذات الأوزان مفتوحة المصدر، وتسارع الطلب على الاستدلال في ذلك الوقت، كانا الإشارتين الأوليتين لهذه الموجة من الطلب على قدرات الحوسبة التي لم تتوقف تقريبًا.

في يناير 2026، شهد سوق قدرات الحوسبة منعطفًا آخر: بعد عدة أرباع من الارتفاع السريع في أسعار DRAM وNAND، دخلت مرحلة قفزات شبه «شبه قطع مكافئ» (parabolic) في الارتفاع. ووفقًا لنموذج التخزين لدينا، اقتربت في الربع الأول من 2026 زيادات أسعار عقود LPDDR5 وDDR5 على أساس سنوي من نحو 4 أضعاف و5 أضعاف على التوالي.

وللتعامل مع مخاطر هامش الربح الناجمة عن الارتفاع الحاد في تكلفة المكونات، بدأت شركات OEM برفع أسعار خوادم الذكاء الاصطناعي، وكانت نسبة الزيادة أعلى بشكل ملحوظ من نسبة الزيادة في تكلفة المكونات الأساسية نفسها. وهذا جعل قرارات الإنفاق الرأسمالي للمجموعات أكثر تعقيدًا: تكاليف شراء الخوادم الأعلى قلصت العوائد المتوقعة للمشاريع، ما أجبر بعض المشغلين على إبطاء وتيرة النشر، بل وحتى التخلي عن بعض المشاريع. ونتيجة لذلك، تم تأخير أو إيقاف بعض الزيادات في العرض التي كان يمكن أن تُطرح في الأصل، ما زاد من حدة التوتر في سوق الإيجار.

خلال فوضى الشراء التي سببتها «السيطرة المفقودة على تسعير خوادم AI»، شهد الطلب على إيجار GPU نموًا متسارعًا بشكل واضح؛ إذ تم استهلاك ما تبقى من قدرات الحوسبة تقريبًا بالكامل في يناير وفبراير. وحتى مارس، لم يعد من الممكن تقريبًا العثور على سعات متاحة لأي مدة إيجار—سواء لـ H100 أو H200 أو B200. تجاوز سعر إيجار السنة حتى نهاية يناير حاجز 2 دولار للساعة لكل GPU، ثم ارتفع مجددًا في منتصف أواخر فبراير مقارنة بنهاية يناير بنسبة 15%–20%، ومن المتوقع أن يرتفع في نهاية مارس على أساس شهري بنسبة 15%–20% أخرى.

أحد المحركات المهمة للطلب في بداية هذا العام جاء من التوليد الأصلي للمحتوى (native media generation). تطبيقات مثل Seedance وNano Banana تدفع المستخدمين إلى توليد وتكرير الصور والفيديو على نطاق واسع، ما يعزز بشكل ملحوظ إنتاجية token. لكن مصدر الطلب الأكثر أهمية والأوضح للعيان هو ظهور أحمال عمل متعددة الوكلاء (multi-agent)—فأنظمة تنفذ خطوات متعددة من العمليات، وتستمر في التكرار في بيئات عالية التوازي، ما يؤدي إلى نمو «أسي» في استهلاك token واحتياجات الحوسبة.

تظهر هذه النزعة بشكل واضح للغاية في بيانات Claude Code ذات الصلة، والتي ذكرناها سابقًا في عدة مقالات. على سبيل المثال، في SemiAnalysis، خلال الأيام السبعة الماضية فقط، استهلكت الشركة عشرات المليارات من tokens، بمتوسط تكلفة يقارب 5 دولارات لكل مليون token. لكن التوفير في الوقت، وتوسيع خطوط العمل، وتحسين القدرات الناتجة، يتجاوز بكثير التكلفة نفسها. والآن، قامت SemiAnalysis بإدخال مجموعة كاملة من أدوات الذكاء الاصطناعي داخل عدة خطوط عمل، ولم تعد تقتصر على البحث والملخصات البسيطة، بل امتدت إلى لوحات البيانات، والالتقاط الآلي، والمعالجة على نطاق واسع للبيانات، وبناء نمذجة مالية قائمة على الوكلاء، وغيرها من السيناريوهات.

كما نتابع هذا الانفجار في الطلب من خلال مؤشرات مثل إجمالي التقديم اليومي لـ Claude (Claude Commits Daily). وبناءً على الاتجاه الحالي، نتوقع أنه بحلول نهاية 2026، ستمثل Claude Code أكثر من 20% من إجمالي عمليات تقديم الكود. ويمكن القول إنه خلال الوقت الذي لم تكن قد لاحظته بعد، بدأت AI «ابتلاع» عملية تطوير البرمجيات بأكملها. وبالنسبة للعملاء المؤسسيين الذين يرغبون في الحصول على هذا الديتاسيت، تواصلوا معنا عبر فريق API الخاص بنا. كشف مبكر: هذه عمليات التقديم، أصبحت أعلى بوضوح من المستوى الذي كنا قد نشرناه لأول مرة.

في دوائرنا، يكاد الجميع مستخدمون كثيفون لـ Claude Code. لكننا ندرك كذلك أن هذه الدائرة نفسها تغوص بعمق في عالم الذكاء الاصطناعي وشبه الموصلات، وهي في جوهرها مجرد «فئة صغيرة على الخط الأمامي».

بالنسبة للعديد من شركات «Fortune 500» ولعموم الجمهور الأوسع، لا يعدّ Claude Code و«عالم الوكلاء» سوى موضوعًا هامشيًا مدهشًا قليلًا، يظهر أحيانًا في موجز Facebook أو في بودكاست NPR. وهم لم يدركوا تقريبًا بعد أن موجة جديدة من الإنتاجية—مدفوعة بالوكلاء—وتأثيرات بنيوية، تقترب بسرعة.

ومع إدراك المزيد من المشاركين من الاقتصاد الحقيقي—على نحو تدريجي—لعوائد الاستثمار المذهلة الناتجة عن استخدام أدوات الذكاء الاصطناعي، والانضمام إلى موجة «الحوسبة»، سيستمر استهلاك token في الارتفاع على شكل درجات متتابعة. أما بالنسبة للجدل حول نسبة العائد إلى التكلفة للاستثمار في الذكاء الاصطناعي، فقد حُسم الأمر بالفعل—فالقيمة التي يخلقها استخدام أدوات الذكاء الاصطناعي غالبًا ما تكون بما يفوق تكلفة ذلك باستمرار بمقدار مرتبة (أو أكثر) على الأقل. وفي ظل هذا السياق، فإن استمرار منحنى الطلب على token في التحرك إلى اليمين يشكل قوة قوية (وفي هذه المرحلة تحديدًا) ذات مرونة نسبية ضعيفة، ما يدفع باستمرار أسعار إيجار GPU إلى الأعلى.

بعبارة بسيطة: إذا كان عائد الاستثمار الناتج عن استخدام أدوات الذكاء الاصطناعي يمكن أن يصل إلى 5–10 أضعاف، فبوسع أسعار إيجار GPU أن تكون لديها مساحة كبيرة للارتفاع قبل أن تتمكن من كبح الطلب فعليًا. كما أننا لا نستبعد أن استمرار ارتفاع أسعار الإيجار سيستمر في النقل صعودًا، ليرفع تكاليف الخوادم والمكونات الأساسية.

إطلاق مؤشر أسعار إيجار SemiAnalysis لعقد H100 لمدة سنة

اليوم، نُتيح مجانًا للجمهور مؤشر أسعار عقود إيجار SemiAnalysis لـ H100 لمدة سنة، بهدف زيادة إدراك السوق لاتجاهات أسعار إيجار GPU وتعزيز الشفافية.

يُبنى هذا المؤشر على بيانات استطلاع شهرية من أكثر من 100 مشارك في السوق (بما في ذلك مزودو Neocloud، ومشترون وبائعون لقدرات الحوسبة) لتحديد نطاقات تمثيلية لأسعار إيجار GPU (النسبة المئوية 25 إلى 75). وفي الوقت نفسه، نستخدم بيانات المعاملات الفعلية للتحقق المتقاطع، ونقوم داخل شبكتنا بعمليات التوفيق بين المشترين والبائعين، ونتولى المشاركة مباشرة في جزء من المعاملات، وذلك لمزيد من المعايرة لمستويات الأسعار.

منذ عام 2023، كنا نتابع عقود أسعار GPU بما في ذلك H100 وH200 وB200 وB300 وGB200 وGB300 عبر مدد إيجار مختلفة من 3 أشهر إلى 5 سنوات؛ كما أدخلنا أيضًا بيانات مرتبطة بسلسلة AMD (MI300 وMI325 وMI355).

وبالمقارنة مع مؤشرات GPU القائمة في السوق، يتميز مؤشر أسعار عقود H100 لمدة سنة لدى SemiAnalysis بعدة فروقات رئيسية:

أولًا، تعتمد العديد من مؤشرات إيجار GPU على عروض السوق الفورية/حسب الطلب (spot/on-demand) أو الأسعار المدرجة علنًا، لكن في الواقع يتم إنجاز أغلب معاملات إيجار GPU عبر عقود طويلة الأجل، وغالبًا ما تكون مدة 6 أشهر أو أكثر. عادةً ما تتشكل هذه الأسعار عبر مفاوضات ثنائية ولا تظهر في أي قواعد بيانات عامة. تميل غالبية مزودي Neocloud الكبار إلى توقيع عقود لا تقل عن سنة واحدة، ويفضلون 2–3 سنوات. وإذا أمكن التوصل إلى اتفاقيات تغطية/تعاقدات كبيرة لمدة 5 سنوات يكون ذلك أفضل. تركيز مؤشر SemiAnalysis لعقود إيجار H100 لمدة سنة هو على «سوق العقود» هذه تحديدًا—أي الجزء الذي تتجمع فيه أحجام التداول الفعلية بشكل أكبر. وبالإشارة الواضحة إلى مدة عقد محددة، يسهل على المستخدمين فهم نطاق السوق الذي يغطيه المؤشر، ويمكن مقارنته كذلك بمتابعاتهم الخاصة للتحقق.

ثانيًا، لا يعني الإعلان العلني عن الأسعار أنها تمثل الأسعار الفعلية التي تمت بها الصفقات. فأسعار الشركات السحابية فائقة الحجم ومزودي Neocloud المنشورة عادة توفر أكثر من كونها مرجعًا لاتجاهات السوق، وليست مستويات المعاملات الفعلية. وغالبًا ما تتأخر هذه الأسعار عن تغييرات سوق العقود، ويتم تعديلها عادة بعد أن يكون الطلب على قدرات الحوسبة قد تغيّر بالفعل. وبالخصوص في سوق حسب الطلب، غالبًا ما يتم ضبط الأسعار بمستوى ثابت نسبيًا، بينما يعكس تغير العرض والطلب نفسه من خلال الاستفادة/معدل استخدام الموارد أو نسبة إشغالها، ولا يتم تعديلها إلا عند الضرورة وبشكل غير منتظم. سيتم توسيع شرح آلية هذا السوق لاحقًا في المقال.

ثالثًا، على الرغم من وجود مؤشرات في السوق يمكنها التعامل مع عروض وأسعار وبيانات معاملات على نطاق واسع وتقديم مزايا في تحليل الاتجاهات، إلا أن طريقتنا تركز أكثر على التفاعل المباشر مع المشاركين في السوق. لكل عرض سعر ولكل صفقة سياقها المحدد ومنطق القرار خلفها. ونأمل أن نُكمل عرض البيانات الكمية بالمعلومات النوعية وملاحظات الخط الأمامي، بما يسمح باستعادة البنية الحقيقية لسوق إيجار GPU بشكل أشمل.

وبالنسبة للمشتركين من المؤسسات، نوفر أيضًا بيانات هيكل مدد كاملة تغطي تقريبًا جميع أسواق إيجار GPU الرئيسية.

بالإضافة إلى نشر مؤشر أسعار عقود H100 لمدة سنة، أطلقنا أيضًا للمشتركين في نماذج Tokenomics على مستوى المؤسسات لوحة معلومات SemiAnalysis Tokenomics Dashboard، وذلك لتتبع وفهم المشهد المتقدم لنماذج الذكاء الاصطناعي. تدعم هذه اللوحة المستخدمين لإجراء مقارنات مخصصة عبر عدة أبعاد مثل الكود والاستدلال والرياضيات وتقييمات الوكلاء، ومقارنة تسعير API لمختلف النماذج ومزودي الخدمات، وعرض البيانات الرئيسية التي تكشف عنها مختبرات ذكاء اصطناعي رئيسية، بما في ذلك استخدام token والإيرادات والتقييم وحجم العملاء.

البنية الحالية لسوق إيجار GPU

قبل النصف الثاني من 2025، كانت بيئة تسعير سوق إيجار GPU أكثر تنافسية نسبيًا. في ذلك الوقت، كان لدى المشغلين مخزون أكبر من GPU في أيديهم، بينما كان الطلب النهائي لا يزال في بداية تسارعه. لذلك، كان التنافس بين مزودي Neocloud قويًا، وكانت كل جهة تسعى للاستحواذ على العملاء عبر أسعار أكثر جاذبية. وكان الهدف الأساسي هو رفع معدل الاستخدام، إلى أقصى حد، من أجل «استنزاف» قيمة أصول قدرات الحوسبة القائمة قبل وصول دورة التحديث التالية لـ GPU.

لكن منذ ذلك الحين، انقلب شكل السوق بزاوية 180 درجة. الآن، أصبح لدى Neocloud والشركات السحابية فائقة الحجم السيطرة الكاملة على زمام المبادرة—يمكنها مطالبة العملاء بدفعات مقدمة أعلى، وتقديم تسعير أفضل، وتمديد مدة العقود، وحتى اختيار توقيت البداية والنهاية للعقود وفقًا لجدولة مخزونها وقدراتها الإنتاجية. وفي الوقت نفسه، الزمن أيضًا في صف جانب العرض: يمكنهم دفع عمليات النشر وفقًا لوتيرتهم، وضمن بيئة أسعار ترتفع باستمرار، يقومون تدريجيًا بتصفية تشكيلة العملاء الأكثر جودة.

ومن الناحية البنيوية، يمكن تقسيم سوق إيجار GPU إجمالًا إلى ثلاثة قطاعات رئيسية، ويقابل كل قطاع نوعًا مختلفًا من احتياجات العملاء:

الإيجارات قصيرة الأجل: حسب الطلب (on-demand)، وعقود الاستباق/الاختطاف (spot)، وعقود أقل من 3 أشهر

عقود متوسطة الأجل: عقود من 3 أشهر إلى أكثر من 3 سنوات

البيع/التغطية طويلة الأجل (offtake): عقود مدتها 4–5 سنوات، حيث تكون 5 سنوات هي الأكثر شيوعًا

الإيجارات قصيرة الأجل: حسب الطلب، والـ spot، والعقود التي تقل عن 3 أشهر

تقع الإيجارات قصيرة الأجل في مقدمة هيكل مدة الإيجار بأكمله، وكثيرًا ما تقابل «السعة المتبقية». ومع ذلك، هناك أيضًا بعض المزودين (مثل Runpod وLambda) يركزون على تقديم قدرة حسب الطلب أو spot بقدار كبير نسبيًا وبمرونة.

من المهم الانتباه إلى أن آلية تسعير سوق حسب الطلب تختلف بشكل ملحوظ عن باقي أسواق العقود. عادةً ما يحدد المزودون مستوى سعر ثابت نسبيًا لموارد حسب الطلب، ولا يقومون بالتعديل إلا في حالات قليلة جدًا. بمعنى آخر، لا يتم دفع أسعار السوق القصيرة الأجل بالكامل بشكل مباشر من خلال العرض والطلب لحظيًا، بل تعكس أكثر تغيّر مستوى استخدام الموارد.

عادةً ما يقوم المزودون بضبط الأسعار مرة واحدة بناءً على معدل استخدام الموارد: عندما يكون معدل الاستخدام منخفضًا، يقومون بخفض الأسعار لتحفيز الطلب؛ وعندما يقترب معدل الاستخدام من الامتلاء، يقومون برفع الأسعار، لأن الطلب يمكن أن يظل مرتفعًا حتى عند مستوى سعر أعلى.

وهذا يفسر لماذا، في قراءة السلاسل الزمنية، غالبًا ما تبقى أسعار حسب الطلب التي ينشرها Neocloud ثابتة لفترة طويلة، ثم تظهر فجأة «قفزة» صعودًا أو هبوطًا. وبالنسبة لسوق حسب الطلب، ما يعكس تغيرات الطلب بدقة وبشكل عالي التواتر ليس السعر، بل معدل استخدام الموارد.

عقود متوسطة الأجل (Mid-Term Contracts)

من الناحية الاقتصادية، الأهم حقًا هو «سوق العقود»، لأن معظم قيمة معاملات إيجار GPU تحدث في هذا القطاع. وتعد عقود السنة تحديدًا مهمة جدًا—فهي تعكس الطلب الهامشي من غير مختبرات الذكاء الاصطناعي، كما تعكس كذلك الطلب الزائد (overflow) من كبار العملاء، ولذلك فهي أكثر المؤشرات حساسية لتقدير مدى انكماش السوق.

شركات الذكاء الاصطناعي الأصلية (AI Natives) ومختبرات الذكاء الاصطناعي الصغيرة والمتوسطة تنشط أساسًا في نطاق 1–3 سنوات. لكن هناك اتجاه واضح مؤخرًا يتمثل في أن هذه المؤسسات بدأت أيضًا في تجربة قفل الحوسبة عبر عقود أطول—وقد امتد كثير منها إلى أكثر من 4 سنوات؛ بل إن بعضها مستعد لدفع أكثر من 20% من الدفعة المسبقة، وهو أمر لم يكن شائعًا في عقود تتجاوز 4 سنوات في الماضي.

البيع/التغطية طويلة الأجل (Long-Term Offtakes)

في سوق 4–5 سنوات الأطول، تكون القوة المهيمنة لدى مختبرات الذكاء الاصطناعي الكبرى، والتي تقوم بحجز قدرات حوسبة واسعة النطاق في وقت مبكر. عادةً ما تقابل هذه المعاملات عناقيد بحجم 50MW و100MW أو أكبر، وهو ما يعادل تقريبًا ما بين 24k و48k بطاقة GB300 NVL72 GPU. وبشكل عام، تشكل هذه الاتفاقيات الطويلة نسبة كبيرة من حصة سوق إيجار GPU لدى Neocloud.

تُفضل مختبرات الذكاء الاصطناعي هذا النوع من العقود لأنها تتيح لها قفل كميات هائلة من قدرات الحوسبة مرة واحدة، لمواجهة النمو السريع في الطلب النهائي. وفي الوقت نفسه، تشارك هذه المؤسسات بعمق في تصميم العناقيد، بما في ذلك تخزين البيانات، الشبكات، وتكوين CPU وغيرها من الأجزاء الرئيسية. وغالبًا ما يتم تسليم هذه المعاملات بصيغة **الحديد العاري (bare metal)**، لأن مختبرات الذكاء الاصطناعي تمتلك قدرات هندسية كافية لتخصيص مكدس التقنيات على مستوى أعمق، بما يحقق أفضل TCO (إجمالي تكلفة الملكية) وأفضل أداء.

بالنسبة لمزودي Neocloud، فإن هذا النوع من الصفقات جذاب أيضًا: فمن ناحية، يمكنهم تركيز موارد البيع على عدد قليل من الطلبات الكبيرة بدلًا من التعامل مع عدد كبير من العملاء الصغار مقابل نفس الإيراد. ومن ناحية أخرى، تسهّل العقود طويلة الأجل أيضًا عمليات التمويل بالديون بشروط أفضل—من خلال مواءمة مدة التمويل مع مدة العقد، يمكن تقليل مخاطر عدم التطابق في آجال الاستحقاق (期限错配) وتقلب الأسعار بشكل فعال، وفي أغلب الحالات يتم تأمين معدلات عائد داخلية على المشروع تبلغ «عشرات النقاط المئوية» (IRR).

إضافة إلى ذلك، غالبًا ما يضطلع عمالقة السحابة فائقة الحجم (Hyperscalers) بدور «المساند/الضامن» (backstop)—حيث يشترون مباشرة من Neocloud ثم يعيدون بيع قدرات الحوسبة إلى مختبرات الذكاء الاصطناعي. هذا الهيكل يصب في مصلحة الجميع: يستطيع Neocloud الحصول على شروط تمويل أفضل اعتمادًا على قدرة الجهة المشترية بتصنيف AAA؛ بينما لا يحتاج عمالقة السحابة فائقة الحجم إلى توسيع ميزانياتهم العمومية، بل يحصلون على جزء من عوائد المشروع عبر تقديم ضمان ائتماني.

يعرض الجدول أدناه بعض اتفاقيات التغطية الكبيرة التي نتابعها حاليًا. سنقوم بتحليل هذه الصفقات بعمق من أجل استنتاج السعر الضمني لساعات GPU ($/hr/GPU) ومؤشرات الربحية الرئيسية مثل IRR للصفقة وهوامش ربح EBIT.

في بيئة السوق الحالية، فإن معظم العناقيد AI الكبيرة التي تتوسع في الواقع يتم «استيعابها داخليًا» من قبل مختبرات الذكاء الاصطناعي. ومع ذلك، ستظل هذه المؤسسات تدخل سوق العقود ضمن 4 سنوات أو أقل لإضافة قدرات حوسبة، كما أنها تمنع—بشكل غير مباشر—عودة العرض إلى هذا السوق من خلال تجديد عناقيد H100 وH200 القائمة. ومع بدء تشغيل عناقيد GB200 وGB300 فائقة الحجم تدريجيًا، سيتحول التغير في علاقة العرض والطلب في سوق العقود المتوسطة 1–3 سنوات إلى متغير مهم يستحق المراقبة في الفترة المقبلة.

«إلى أين ستتجه الكرة؟» (Where The Puck is Going)

أكثر ما يلفت الانتباه حاليًا هو الانفصال الواضح بين الواقع الأساسي ومشاعر السوق. رغم أن إشارات تضيق العرض وارتفاع الأسعار—التي يفترض أنها تصب في مصلحة Neocloud (توسع هامش الربح وإطالة عمر استخدام الأصول)—قد أصبحت واضحة للغاية، إلا أن السوق العلني أصبح أكثر تشاؤمًا تجاه شركات مثل CoreWeave وNebius وIris Energy؛ وما زالت أسعار أسهمها حاليًا عند مستويات أدنى من النطاق الذي كانت عليه خلال آخر 6–12 شهرًا.

ما يزال السوق يهيمن عليه سردية «انتهاء المطاف بفائض نهائي وتحول قدرات الحوسبة إلى سلعة»، ولم تعمل هذه التغييرات فعليًا على تخفيف قلق المستثمرين بشأن القيمة طويلة الأجل لـ GPU. لكن من واقع الخط الأمامي، تعني حالة استمرار شح العرض وتعزيز سلطة التسعير أن معظم قدرات الحوسبة موجودة تقريبًا في حالة «يتم امتصاصها» بواسطة الطلب—حتى مع وجود اختلافات في الأداء، وفي ظل هذا النقص الحاد للغاية، ما زال هناك طلب يفوق العرض.

ثلاث نقاط مراقبة رئيسية في المستقبل

لتحكم ما إذا كان بإمكان أسعار إيجار GPU الاستمرار في البقاء مرتفعة، يمكن التركيز على ثلاثة متغيرات:

1، وتيرة توسع عناقيد GB300 (2026)
العبرة هنا في السرعة النسبية بين إضافة قدرات الحوسبة واحتياج token—هل سيخفف العرض من حدة التوتر، أم سيواصل الطلب تجاوز العرض. وسيؤثر ذلك مباشرة على ما إذا كانت مختبرات الذكاء الاصطناعي ستواصل المشاركة في سوق العقود التي تقل عن 4 سنوات، وعلى مسار الأسعار في ذلك النطاق.

2، هل سيزداد نقص الشرائح سوءًا
يشمل ذلك طاقة إنتاج عملية N3 لدى TSMC، وHBM وDRAM وNAND وغيرها من المراحل الرئيسية—أي تقلبات على مستوى تنفيذ التصنيع قد تضيق العرض أكثر.

3، معدل نمو إيرادات مختبرات الذكاء الاصطناعي (ARR) ونمو استهلاك token
إن التوسع في استثمار الذكاء الاصطناعي نحو التوسع التجاري وحجم الاستخدام سيحدد قوة الطلب النهائي، وهو أيضًا المتغير الأساسي الدافع لطلب قدرات الحوسبة.

الأسعار تتجه باتجاه واحد صعودًا، وتتحسن العوائد تبعًا لذلك

بشكل شامل، يمكن استخلاص نتيجة أكثر وضوحًا وهي: احتمالية استمرار ارتفاع أسعار إيجار GPU أعلى من احتمالية تراجعها.

تتميز هذه العملية بسمات قوية للتعزيز الذاتي: عندما يلاحظ Neocloud تضيق العرض وارتفاع الأسعار، فإنه سيقوم مسبقًا بحجز المزيد من العتاد، ما يؤدي إلى ضغط إضافي على عرض السوق ودفع الأسعار لمواصلة الارتفاع. وهذا يشبه دورة نقص GPU في 2023–2024—عندها أدى ضيق العرض إلى تحقيق OEM لتوسع كبير في أرباحها، ما دفع أيضًا إلى ارتفاع كبير في أسعار الخوادم (رغم أن نضج السوق في هذه الجولة أعلى، فقد لا يتكرر هذا المسار بالكامل).

وفي الوقت نفسه، فإن الارتفاع مجددًا في أسعار إيجار GPU يحسّن عائد رأس مال Neocloud (ROIC):

من ناحية، يرفع هامش ربح الأصول المُنشرَة

ومن ناحية أخرى، يطيل دورة الاستخدام الاقتصادية لـ GPU، مما يسمح لرأس المال بتوليد تدفقات نقدية على مدى أطول

من هو أكبر المستفيدين الحاليًا؟

أكثر المستفيدين مباشرة الآن هم مزودو قدرات الحوسبة الذين يمتلكون السمات التالية:

· الاعتماد على عقود قصيرة الأجل (إعادة تسعير سريعة)

· امتلاك كميات كبيرة من أجهزة H100 المتوفرة مسبقًا

· ظهور طاقة إنتاجية جديدة خلال الأجل القصير

يمكن لـ Neocloud في هيكل الإيجارات القصيرة تحرير العقود القديمة بشكل أسرع وإعادة التعاقد بأسعار أعلى، ما يحقق بسرعة توسعًا في الأرباح. وفي الوقت نفسه، فإن عمالقة السحابة فائقة الحجم وNeocloud الذين قاموا بحجز قدرات الجيل التالي مسبقًا (عبر عقود متعددة السنوات) سيستفيدون أيضًا في الدورة القادمة.

لكن السؤال: هل سيكون هذا الأمر حقًا «غير مختلف» هذه المرة؟

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.24Kعدد الحائزين:0
    0.00%
  • القيمة السوقية:$2.23Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.24Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:0
    0.00%
  • القيمة السوقية:$2.27Kعدد الحائزين:2
    0.07%
  • تثبيت