شركة سونتروتيك أطلقت نسخة "مجهزة قياسيًا" من العقدة الفائقة، هل هي الشكل المستقبلي لقوة الحوسبة في استنتاجات الذكاء الاصطناعي؟

MaticHoleFiller · 2026-04-08T15:49:27+00:00

انتشار OpenClaw أدى إلى إعادة تقييم سوق قوة الحوسبة للاستدلال بالذكاء الاصطناعي. أصدرت شركة @E0@ scaleX40، وهو يبسط عملية النشر ويزيد من كفاءة الحوسبة، مما حل العديد من الاختناقات في الخوادم التقليدية ذات الـ8 بطاقات، وساهم في نضوج بيئة قوة الحوسبة للذكاء الاصطناعي.

MaticHoleFiller

2026-04-08 15:49:27

إنشاء الملخص قيد التقدم

المصدر: تي ميديا

انفجر OpenClaw فجأة بشعبية كبيرة؛ فذلك لا يعني فقط أنه أمرٌ حتمي لخروج حاد من عالم AI Agent إلى دائرة الضوء، بل يُعد أيضًا اختبار ضغط لسوق قدرات الحوسبة للاستدلال الخاص بالذكاء الاصطناعي.

في منتدى بكينغتشونغ (منتدى معهد زونغ قوان تشونغ) في منتصف عام 2026، أطلقت شركة 中科曙发布 أول عقدة فائقة لا سلكية من نوع صندوق/خزانة بمقياس scaleX40 في العالم. وقبل ذلك كانت العقد الفائقة عملاقًا هائلًا بحجم يتراوح عادةً بين مئات البطاقات وحتى آلاف البطاقات، بما في ذلك scaleX640 الذي أطلقته 中科曙光، وNVL72 الخاص بـ NVIDIA، و昇腾384 الخاص بـ هواوي.

صُممت هذه العقد الفائقة من الدرجة الأولى للتدريب على نماذج بأحجام هائلة، وتتمتع بأداء قوي جدًا، لكن عتبة النشر فيها مرتفعة للغاية: خزائن/رفوف مخصصة، وصلات كابلات معقدة، وفِرق تشغيل وصيانة احترافية؛ واستثمارات قد تبلغ عشرات الملايين بل وحتى مئات الملايين، ما يجعلها حتمًا تخدم فئة قليلة من اللاعبين في القمة، مثل عمالقة الإنترنت أو المؤسسات الكبيرة المملوكة للدولة/القطاع المركزي كبرى.

وعلى الجانب الآخر من العقد الفائقة، توجد خوادم GPU تقليدية وشائعة بثماني بطاقات في سوق الاستدلال. هذه المنتجات مرنة وسهلة النشر من حيث التكلفة ويمكن التحكم فيها، لكن عند مواجهة احتياجات الاستدلال المتزايدة بسرعة من حيث قدرات الحوسبة، يظهر أن الأداء لا يزال غير كافٍ بعض الشيء.

“حالياً، تُعتبر آلة من 8 بطاقات متأخرة جدًا عن الركب؛ وحتى إذا قمنا بتوسيع النطاق من حيث الاتصال إلى 16 بطاقة، فلن يكون ذلك كافيًا لمواكبة وتيرة تطور خدمات استدلال النماذج.” قال لي بينغ، كبير نائب الرئيس لشركة 中科曙光، “إن البنية التحتية للحوسبة التي تدعم تطور الذكاء الاصطناعي تتغير تدريجيًا؛ من ‘مصنع الحوسبة’ في السابق إلى ‘مصنع Token’. لقد تحوّل المستخدمون الرئيسيون لنظام الحوسبة: لم يعودوا بشكل أساسي لدعم تدريب النماذج كما في الماضي، بل أصبحوا الآن يركزون على تقديم خدمات الاستدلال.”

في عصر التدريب، كان المعيار الأساسي لتقييم نظام الحوسبة هو مقدار القدرة الحوسبية. أما في عصر الاستدلال، فالأهم يتحول إلى أن يكون بإمكانك “إنتاج Token بتكلفة اقتصادية متعددة”.

الصورة مقدمة من توليد بالذكاء الاصطناعي

تباين الطلب على الذكاء الاصطناعي، والاستدلال لم يلبِّ بعد

وفقًا لاحتياجات السوق الحالية، تشهد بنية قدرات حوسبة الذكاء الاصطناعي تغيرًا طبقيًا. ووفقًا لتوقعات جهات بحثية في المجال، ستواصل استثمارات البنية التحتية للذكاء الاصطناعي عالميًا الحفاظ على نمو سريع نسبيًا، لكن الطلبات الجديدة ستتحول تدريجيًا من المجموعات فائقة الحجم إلى سيناريوهات على مستوى المؤسسات والتطبيقات الخاصة بالقطاعات.

ضمن هذا الاتجاه، لم يعد التركيز في تكوين قدرات الحوسبة هو السعي الأحادي وراء الحد الأعلى من الحجم، بل أصبح أكثر اهتمامًا بالتوازن بين الأداء والتكلفة والمرونة. وعلى نطاق الصناعة، يتفق الجميع تقريبًا على أن حجم عشرات البطاقات يكفي لتلبية احتياجات قدرات الحوسبة لتدريب نماذج معظم السيناريوهات الصناعية، والاستدلال، واختبارات التطوير—وهذا هو أيضًا “نطاق العدد” الذي يوازن بشكل أكبر بين الكفاءة والاستثمار.

لكن تطور احتياجات طبقة تطبيقات الذكاء الاصطناعي سريع للغاية؛ فمع انفجار شعبية AI Agent ممثلة بـ OpenClaw، ومع تغييرها لطريقة تطبيقات الصناعات التقليدية، برزت أيضًا الحاجة إلى إعادة بناء على جانب إمداد قدرات الحوسبة في الوقت الراهن.

أولاً: عنق الزجاجة في الاتصالات. في نماذج MoE، تصبح الاتصالات هي النقطة الأساسية التي ترفع كفاءة استخدام قدرات الحوسبة. وخصوصًا عدم اليقين في توزيع الخبراء، ما يؤدي إلى كميات كبيرة من الاتصالات عبر البطاقات وعبر الأجهزة، ويضرب مباشرةً بنية قدرات الحوسبة للخوادم التقليدية ذات 8 بطاقات.

ثانيًا: عنق الزجاجة في سعة الذاكرة (显存). تستمر نوافذ السياق في التوسع، وتحتاج قدرات الذاكرة طويلة السياق التي يعتمدها OpenClaw إلى قدرة حفظ طويلة الأمد، ما يؤدي إلى زيادة متطلبات الذاكرة الكبيرة وKV Cache بشكل متسارع أيضًا—وهو ما يمثل أيضًا حدًا يصعب على خوادم 8 بطاقات التقليدية تجاوزه.

ثالثًا: عنق الزجاجة في كفاءة استخدام قدرات الحوسبة. تكاد كفاءة استخدام قدرات الحوسبة تكون عكسية تقريبًا مع تكلفة تحقيق الاستدلال. تعاني المجموعات التقليدية عمومًا من مشكلة انخفاض كفاءة استخدام قدرات الحوسبة. والتحدي الأساسي ليس مجرد تكديس معدات، بل تحقيق قفزة مزدوجة في كفاءة النظام والقدرة الحوسبية الفعالة عبر الابتكار في بنية العتاد، مع التضافر بين هندسة النظام المصاحبة وهندسة التحسينات.

رابعًا: عنق الزجاجة في النظام البيئي. إن نظام قدرات الحوسبة المحلية (国产算力) معقد، وفيه عدد كبير من الشركات، وسلسلة الصناعة طويلة نسبيًا، وليست صعبة في التعاون الصناعي. لذا يلزم الاستعانة ببنية حوسبة مفتوحة (开放计算架构) لربط جميع المراحل والتكامل بين سلسلة الصناعة الكاملة من الرقائق (chips) إلى النماذج إلى التطبيقات، وبناء قاعدة قدرات حوسبة مفتوحة وسهلة الاستخدام، “جاهزة للاستخدام من أول إخراج” وميسّرة اقتصاديًا للجميع.

تأمل 中科曙光 أن ترد على السوق عبر عقدة فائقة من 40 بطاقة كـ"تجهيز معياري". قال 李柳، نائب رئيس 中科曙光: “منطقة الـ40 بطاقة هي ‘المنطقة الحلوة’ التي استطعنا تحديدها عبر استطلاعات وتحصيلات بحثية مع مختلف العملاء. فبالنسبة لحجم معلمات النماذج السائدة وسيناريوهات الاستخدام الحالية، يمكن لـ32-40 بطاقة أن تغطي احتياجات معظم القطاعات، مع مراعاة توازن التكلفة والأداء.”

تتكامل عقدة scaleX40 في عقدة واحدة مع 40 بطاقة GPU، ليكون إجمالي القدرة الحوسبية أكثر من 28PFLOPS (FP8 Precision)، وسعة HBM للذاكرة تتجاوز 5TB، وعرض النطاق الترددي للقراءة/الوصول إلى الذاكرة يتجاوز 80TB/s. وتم رفع موثوقية النظام إلى 99.99%.

تكوين scaleX40 على مستوى الحجم يوفر القدرة على دعم تدريب النماذج الكبيرة والاستدلال دون أن يسبب ضغط استثمار زائد. فمن ناحية الأسفل، يمكن تهيئته بما يلائم 32 بطاقة لتلبية تدريب واستدلال واختبارات تطوير بحجم متوسط وصغير. ومن ناحية الأعلى، يمكن توسيعه لتشكيل عنقود أكبر.

قام 李斌 بحساب: “إن الاستثمار في تكديس 5 أجهزة من نوع 8 بطاقات مع مختلف التكاليف يكون تقريبًا على قدم المساواة مع scaleX40، لكن scaleX40 يمكنه رفع أداء التدريب بنسبة 120%، ورفع أداء الاستدلال إلى أقصى حد 330%.”

من DeepSeek إلى OpenClaw: نقطة التحول الجديدة في قدرات الحوسبة

“تحتاج Token إلى قدرات حوسبة لإنتاجها، لكن أبعاد التقييم والمؤشرات أصبحت أكثر.” يرى 李斌: “بالنسبة للمستخدم العادي، ما يهم هو سرعة الاستجابة؛ فإذا طرحت سؤالًا، هل يمكنها أن تُرجع إجابة بسرعة؟ وبالنسبة لمشغلي نظام قدرات الحوسبة، يجب التفكير في عدد المستخدمين الذين يمكنهم دعم وصول متزامن لهم في الوقت ذاته، مع تلبية تجربة استخدام أساسية.”

كما طرح المسؤول عن قسم تطوير أطر العمل (AI framework) في معهد Zhiyuan للبحث، 敖玉龙، أيضًا: “في المستقبل، بالنسبة لطرف إمداد قدرات الحوسبة، فإن المؤشر الرئيسي هو كيفية تحويل قدرات الحوسبة إلى Token فعّال، وليس إلى Token غير فعّال. من يستطيع خفض هذه التكلفة إلى أدنى حد، فهو الفائز الحقيقي.”

تدور تصميمات scaleX40 حول هذه الاحتياجات الجديدة. يدعم حجم ذاكرة كبيرة 144G نوافذ سياق طويلة، وتلبي آلية ذاكرة التخزين المؤقت متعددة المستويات لـKV Cache متطلبات ذاكرة كبيرة في سيناريوهات الاستدلال. ويستوعب الربط الأولي عالي عرض النطاق لمجال interconnect من فئة 40 بطاقة تدفقات out-to-out لاتصالات الخبراء داخل عقدة واحدة. وهذه الخصائص كلها تهدف إلى تعظيم كفاءة إنتاج Token لكل وحدة من قدرات الحوسبة، مع التحكم في التكاليف.

يُعد التصميم اللاسلكي للخزائن/صناديق الكابلات أيضًا أحد أكبر نقاط التفرد في scaleX40. تتمثل المشكلة الأساسية في العقد الفائقة التقليدية في تعقيد النشر. على سبيل المثال، تستخدم NVIDIA NVL72 مخطط اتصال يعتمد على وصلات كابلات نحاسية؛ إذ تحتاج الخزائن فيما بينها إلى عدد كبير من التوصيلات بالكابلات. لا يقتصر ذلك على اشتراطات صارمة لبيئة غرفة الخوادم فحسب، بل يطيل كذلك دورة النشر، كما أن معدل الأعطال في عمليات الصيانة اللاحقة مرتفع أيضًا.

والحل الذي قدمته scaleX40 يشبه أحدث الحلول التي أعلنت عنها NVIDIA في مؤتمر GTC لهذا العام؛ حيث يتم تحقيق التوسع Scale-up عبر تقنية الناقل (bus)، وتستخدم عقد الحوسبة وعقد التبديل بنية لا سلكية متعامدة مع بعضها عبر توصيل مباشر (direct insert).

أدى هذا التصميم إلى مكاسب متعددة: أولاً، تصل أداء تقنية الناقل إلى أكثر من 10 أضعاف أداء شبكة NDR التقليدية، كما تدعم الدلالات الخاصة بالذاكرة والعناوين الموحدة للذاكرة وذاكرة الوصول العشوائي للعرض (显存统一编址)؛ ثانيًا، تقلل طبقة واحدة في الشبكات (组网) زمن التأخير باتجاه واحد P2P إلى أقل من مئة نانوثانية. بالمقارنة مع الشبكات ذات طبقتين (二层组网)، ينخفض زمن التأخير بأكثر من 30%، كما ينخفض معدل الأعطال بنسبة 30%-50%.

ثانيًا، تعتمد scaleX40 تصميم صندوق قياسي مقاس 19 بوصة؛ ويبلغ ارتفاع جهاز واحد 16U فقط، ويمكن وضعه مباشرة داخل خوادم/خزائن البيانات السائدة (mainstream rack)، متوافقًا مع بيئة مراكز البيانات الحالية دون الحاجة إلى تعديل إضافي.

“في الماضي كانت منتجات كثيرة إما أن حجم الخزانة كبير، أو غير قياسية، أو أن تعديل غرفة الخوادم كان معقدًا للغاية.” قال 李柳: “يمكن وضع scaleX40 داخل خزانة معيارية، مع توصيلها مباشرة بتغذية الطاقة والتبريد الخاصة بغرفة الخوادم القياسية. وبذلك يتم خفض عتبات النشر والاستخدام بشكل كبير.”

كما قال 王子潇، المسؤول عن تقنيات الشبكات الذكية/القابلة للحوسبة (智算网络技术) في معهد أبحاث China Telecom: “تقديم خدمات الاستدلال في شكل عقد فائقة يرفع الأداء بحوالي 2.6 مرة مقارنة بخادم تقليدي منفرد ذي 8 بطاقات. إن قدرة ‘جاهزة للاستخدام عند الفتح’ للعقد الفائقة عززت بشكل واضح. كما انخفضت درجة تعقيد تهيئة الشبكة Scale-out بمقدار ترتيب واحد من حيث الحجم. وهذا مهم للغاية لتطبيقات التوسع على نطاق الصناعة.”

من منظور أعمق، يعكس إصدار scaleX40 أيضًا نضج نظام قدرات الحوسبة المحلي. من الرقائق إلى برامج النظام، ومن التخزين إلى الشبكة، ومن مكتبة العمليات إلى مكتبة الاتصالات، تتشكل سلسلة صناعية كاملة. وكما قال 李斌: “في نظامنا البيئي المحلي للحوسبة والذكاء الاصطناعي، نحن نعمل على تنسيق عمودي عبر الطبقات—من الرقائق إلى برامج النظام، ومن النماذج والتطبيقات على المستوى الأعلى—ونستفيد من كفاءة أفضل عبر الاقتران والتنسيق العمودي.”

عندما تبدأ العقد الفائقة بالتم نشرها واستخدامها بطريقة أبسط، وحين يتمكن كل من عشرات/مئات الآلاف من القطاعات والصناعات من الحصول على قدرات حوسبة عالية الجودة بتكلفة معقولة، فقد تكون التطبيقات واسعة النطاق للذكاء الاصطناعي في الصين قد خطت فعلاً خطوة محورية إلى الأمام. (مؤلف هذا المقال | 张帅، المحرر | 杨林)

إعلان خاص: إن المحتوى أعلاه يمثل فقط آراء وموقف المؤلف الشخصي، ولا يمثل بالضرورة آراء أو مواقف Toutiao المالي التابع لـ Sina. إذا كان يلزم التواصل مع Toutiao المالي التابع لـ Sina بخصوص المحتوى أو حقوق النشر أو أي مشكلات أخرى، فيرجى القيام بذلك خلال 30 يومًا من تاريخ نشر المحتوى المذكور أعلاه.

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.