اقتصاديات رمز جيه سون هوانغ

K-LinePoet · 2026-03-17T13:31:03+00:00

مراسل تقرير المراقب الاقتصادي تشنغ تشن ييمؤتمر GTC الخاص بشركة إنفيديا، الذي يُعتبر منذ فترة طويلة بمثابة نقطة المرجع السنوية لاتجاهات صناعة الذكاء الاصطناعي، عُقد هذا العام من 16 إلى 19 مارس في سان خوسيه بولاية كاليفورنيا بالولايات المتحدة الأمريكية.في الساعة 11 صباحاً بالتوقيت المحلي في 16 مارس (الساعة 2 صباحاً بتوقيت بكين في 17 مارس)، ألقى الرئيس التنفيذي لشركة إنفيديا جين سون هوانج محاضرة رئيسية استغرقت أكثر من ساعتين في مركز SAP في سان خوسيه.توقع جين سون هوانج في محاضرته أن احتياجات البنية التحتية العالمية المتعلقة بالذكاء الاصطناعي ستصل إلى تريليون دولار بحلول عام 2027. وقال أيضاً إن الطلب الفعلي قد يكون أعلى بكثير من تريليون دولار، وقد تواجه منتجات إنفيديا نقصاً في العرض.بعد نشر هذا الرقم، ارتفع سعر سهم إنفيديا في السوق الأمريكية بأكثر من 4% على الفور. لكن بعد عدة ساعات، عندما فتح السوق الصيني الرئيسي، انخفضت أسهم سلسلة صناعة قوة المعالجة بشكل جماعي، وأغلق سهم Tianfo Communications (300394) (300394.SZ) بانخفاض يزيد عن 1

K-LinePoet

2026-03-17 13:31:03

مراسل المراقبة الاقتصادية Zheng Chenye

يُعرف مؤتمر GTC لشركة NVIDIA، الذي يُعد مؤشرًا رئيسيًا لاتجاهات صناعة الذكاء الاصطناعي، بأنه حدث سنوي يُعقد في 16-19 مارس في سان خوسيه، كاليفورنيا، الولايات المتحدة.

في صباح يوم 16 مارس بالتوقيت المحلي، الساعة 11 صباحًا، أي فجر 17 مارس بتوقيت بكين، ألقى الرئيس التنفيذي لشركة NVIDIA، Huang Renxun، خطابًا رئيسيًا استمر لأكثر من ساعتين في مركز SAP بسان خوسيه.

توقع Huang في خطابه أن تصل الطلبات على البنية التحتية للذكاء الاصطناعي على مستوى العالم إلى تريليون دولار بحلول عام 2027. وأضاف أن الطلب الفعلي قد يكون أعلى بكثير من تريليون دولار، وأن منتجات NVIDIA قد تكون غير كافية لتلبية الطلب.

بعد إعلان هذا الرقم، ارتفعت أسهم NVIDIA في السوق الأمريكية بشكل فوري بأكثر من 4%. لكن بعد ساعات قليلة، عند افتتاح سوق الأسهم الصينية، شهدت أسهم سلسلة صناعة الحوسبة تراجعًا جماعيًا، حيث انخفض سهم Tianfu Communication (300394.SZ) بأكثر من 10%، وانخفض سهم Changguang Huaxin (688048.SH) بنسبة 9.72%، وتراجع معظم الأسهم الرائدة بما يقرب من 5 أيام من الارتفاع.

الفارق بين التوقعات بتريليون دولار وانخفاض أسهم السلسلة الصناعية يرجع إلى مقياس الزمن.

Huang يتحدث عن توقعات الطلب المستقبلية، لكنه أشار إلى أن الجيل التالي من معمارية شرائح Feynman لن يُطرح حتى عام 2028. بالإضافة إلى ذلك، ذكرت شركة Wanlian Securities في تقرير بحثي صدر في 16 مارس أن متوسط نسبة السعر إلى الأرباح في قطاع الإلكترونيات في السوق الصينية (A股) حتى 15 مارس كان حوالي 82 مرة، مما يعكس قلق السوق من ارتفاع الأسعار.

لكن ما يستحق الانتباه في خطاب Huang ليس الرقم نفسه، بل أنه استعرض خلال ساعتين من الزمن منطقًا تجاريًا جديدًا: أن مراكز البيانات تتغير من كونها مكانًا لتدريب النماذج إلى أن تصبح مصانع لإنتاج الرموز (Tokens).

الرموز (Tokens) هي الوحدة الأساسية لمعالجة المعلومات في النماذج اللغوية الكبيرة، ويمكن فهمها بشكل تقريبي على أنها أجزاء من النص يتم معالجتها أو توليدها بواسطة الذكاء الاصطناعي، حيث يعادل كل حرف صيني تقريبًا واحدًا إلى اثنين من الرموز.

خلال العامين الماضيين، شهد استهلاك الرموز عدة قفزات كبيرة.

عزا Huang هذه التطورات إلى ثلاث مراحل رئيسية: في نهاية عام 2022، أطلقت ChatGPT، وتعلم الذكاء الاصطناعي كيفية توليد المحتوى، وبدأ في استهلاك الرموز بكميات هائلة؛ بعد ظهور نموذج ChatGPT o1، تعلم الذكاء الاصطناعي الاستنتاج والتفكير، حيث يحتاج إلى توليد الكثير من الرموز داخليًا ليقوم بعمليات التفكير؛ بعد إصدار Claude Code (أداة برمجة ذكاء اصطناعي طورتها شركة Anthropic)، أصبح بإمكان الذكاء الاصطناعي قراءة الملفات، وكتابة الشفرات، واختبارها، حيث يستهلك كل مهمة من الرموز أكثر بكثير من المحادثات البسيطة.

ذكر Huang أن جميع مهندسي البرمجيات في NVIDIA يستخدمون الذكاء الاصطناعي للمساعدة في البرمجة.

يتم تقسيم عمل الذكاء الاصطناعي إلى مرحلتين: التدريب، وهو عملية جعل النموذج أكثر ذكاءً، وتتطلب استثمارًا كبيرًا؛ والاستنتاج، وهو عملية تنفيذ النموذج للأعمال، وتحدث يوميًا، مع تزايد الطلب عليها. في الماضي، كانت معظم عمليات شراء وحدات معالجة الرسوميات (GPU)، وهي المكون الرئيسي للحوسبة في الذكاء الاصطناعي، موجهة نحو التدريب، لكن التركيز الآن يتحول نحو الاستنتاج.

قال Huang إن حجم أعمال مزودي خدمات الاستنتاج زاد بمقدار 100 مرة خلال العام الماضي. وأكد المحلل في IDC China، Du Yunlong، أن السوق المحلية في الصين تتجاوز الآن معدل النمو والحصة السوقية لعمليات الاستنتاج، حيث تشير قيمة شحنات الخوادم إلى أن حصة الاستنتاج تقترب من 60%.

على الرغم من أن الطلب على الاستنتاج يتفجر، إلا أن رموز Token لم تتشكل بعد في نظام تسعير سوقي.

قدم Huang خمسة مستويات سعرية مستقبلية: المستوى المجاني، حيث يتم إنتاج رموز بكميات كبيرة ولكن بسرعة استجابة بطيئة؛ المستوى المتوسط، حوالي 3 دولارات لكل مليون رمز؛ المستوى العالي، حوالي 6 دولارات لكل مليون رمز؛ المستوى السريع، حوالي 45 دولارًا لكل مليون رمز؛ وأعلى مستوى، حوالي 150 دولارًا لكل مليون رمز. وكلما زاد حجم النموذج، وطول السياق، وسرعة الاستجابة، زادت تكلفة الرموز.

أعطى مثالًا على أعلى مستوى: فريق بحثي يستخدم 50 مليون رمز يوميًا، وإذا حسبنا السعر عند 150 دولارًا لكل مليون رمز، فسيكون المجموع 7500 دولار، وهو مبلغ غير مهم للشركات. بعد زيادة حجم النافذة السياقية من 32 ألف رمز إلى 400 ألف رمز، يمكن للذكاء الاصطناعي قراءة عقد كامل أو قاعدة بيانات كاملة مرة واحدة، وهو ما يتيح إنجاز مهام لم تكن ممكنة سابقًا.

مع وجود تسعير متعدد المستويات، يتغير النموذج الاقتصادي لمراكز البيانات.

قال Huang إن كل مركز بيانات يتعرض لقيود في الطاقة، وأن مركز البيانات بقدرة 1 جيجاوات لن يتحول أبدًا إلى 2 جيجاوات، وذلك بسبب قيود الكهرباء والأرض. في ظل قدرة ثابتة، من يستهلك كل واط من الطاقة لإنتاج أكبر قدر من الرموز هو الذي يكون لديه أدنى تكاليف إنتاج. بمعنى آخر، بنفس استهلاك الكيلوواط، من يحقق إنتاجية أكبر من الرموز يحقق أرباحًا أكبر.

عرض Huang مجموعة من الأرقام: مركز بيانات بقدرة 1 جيجاوات، إذا وزع قدراته على مستويات سعرية مختلفة، فإن إيرادات استخدام معمارية Blackwell الحالية من NVIDIA تبلغ حوالي 30 مليار دولار سنويًا، وإذا استبدلها بمعمارية Vera Rubin الجديدة، فستصل إلى حوالي 150 مليار دولار، بالإضافة إلى أن معالج Groq LPU للتسريع في الاستنتاج يمكن أن يحقق إيرادات تصل إلى 300 مليار دولار. نفس مركز البيانات، مع استبدال الأجهزة، يمكن أن يحقق إيرادات تصل إلى عشرة أضعاف.

تتوقع NVIDIA أن تصل إيراداتها للسنة المالية 2026 إلى 215.9 مليار دولار، وأن يساهم قطاع مراكز البيانات بـ 193.7 مليار دولار منها.

وفقًا لمنطق Huang، لم تُستغل مراكز البيانات الحالية بشكل كامل، وإذا استبدلت بأجهزة الجيل الجديد، يمكن أن تتضاعف الإيرادات عدة مرات بنفس القدرة الكهربائية. وهكذا، فإن التوقع بتريليون دولار ليس بسبب ارتفاع أسعار الرقائق، بل لأنه يمكن إنتاج رموز أكثر وأغلى باستخدام نفس الطاقة.

قال Huang إن كل رئيس تنفيذي في المستقبل سيراقب أداء مصنع الرموز الخاص به، لأنه مرتبط مباشرة بالإيرادات.

وصف أيضًا ظاهرة جديدة تظهر في وادي السيليكون: أن المزيد من المهندسين يستخدمون الذكاء الاصطناعي يوميًا لكتابة الشفرات، وإجراء الأبحاث، ومعالجة المستندات، وكل ذلك يستهلك الرموز، مما يجعل الشركات مضطرة لميزانية مخصصة لهذا الاستخدام.

وتوقع Huang أن تكون هذه النفقات كبيرة لدرجة تتطلب تخصيص ميزانية خاصة، تمامًا كما تخصص الشركات ميزانية لأجهزة الكمبيوتر والبرمجيات لموظفيها.

كما ذكر أن كل مهندس جديد سيحصل عند انضمامه على ميزانية سنوية للرموز، تعادل تقريبًا نصف راتبه الأساسي.

نوعان من الشرائح

الاقتصاد القائم على الرموز الذي يطرحه Huang يتوافق مع منصة Vera Rubin التي أُعلنت رسميًا في GTC.

قال Huang إن الحديث عن معمارية Hopper كان يركز على قطعة واحدة من الشريحة، لكن Vera Rubin ليست مجرد قطعة، بل نظام كامل. هذا النظام يحقق تبريدًا سائلًا بنسبة 100%، وتقليل وقت التركيب من يومين إلى ساعتين.

تتكون Vera Rubin من سبع شرائح. النواة، NVL72، تتضمن 72 وحدة معالجة رسوميات Rubin و36 وحدة معالجة مركزية Vera، متصلة عبر NVLink 6 (تقنية NVIDIA للربط عالي السرعة بين الشرائح). مقارنة بالجيل السابق Blackwell، فإن الأداء لكل واط في الاستنتاج زاد بمقدار 10 أضعاف، وتكلفة كل رمز انخفض إلى عُشرها.

أطلقت NVIDIA أيضًا معالج Vera CPU الجديد ذو 88 نواة، والذي تم تحسينه خصيصًا لسيناريوهات الوكيل الذكي ومعالجة البيانات.

قال Huang إن الرئيس التنفيذي لشركة Microsoft، نادلا، أكد له أن أولى أرفف Vera Rubin تعمل الآن على منصة Azure السحابية.

لكن Vera Rubin لديها عيب، حيث قال Huang إن عند حاجة كل مستخدم إلى توليد أكثر من 400 رمز في الثانية، فإن عرض النطاق الترددي لـ NVL72 يصبح غير كافٍ. الحل لهذه المشكلة هو شركة Groq، التي تأسست عام 2016، والتي استحوذت عليها NVIDIA سابقًا على تقنياتها وفريقها الأساسي.

LPU (وحدة معالجة اللغة) من Groq وGPU من NVIDIA يختلفان تمامًا. الذاكرة في GPU كبيرة، وقوته الحاسوبية عالية، حيث تحتوي كل وحدة Rubin GPU على 288 جيجابايت من الذاكرة، وتناسب المعالجة المعقدة. أما LPU، فهي صغيرة الحجم ولكنها سريعة جدًا في القراءة والكتابة، حيث تحتوي على 500 ميجابايت فقط من الذاكرة، ولا يمكنها استيعاب كامل معلمات النموذج الكبير، لكنها أسرع بكثير في توليد الرموز وتقليل التأخير مقارنة بـ GPU.

تستخدم NVIDIA برنامج Dynamo لإدارة عمليات الاستنتاج، الذي يقسم العملية إلى خطوتين: فهم السياق الذي يتطلب الكثير من الحوسبة والذاكرة، يُعالج بواسطة Vera Rubin، وتوليد الرموز الذي يتطلب استجابة سريعة، يُعالج بواسطة Groq LPU. يتصلان عبر شبكة إيثرنت عالية السرعة، مما يقلل التأخير بنسبة تقارب النصف.

يسمي Huang هذا الأسلوب “الاستنتاج المفصول” (أي تقسيم عملية الاستنتاج بين شرائح مختلفة)، والفكرة الأساسية هي أن الأداء العالي والتأخير المنخفض يتعارضان بطبيعته، لذا من الأفضل أن تتخصص كل شريحة في مهمة معينة.

قال إن هذا التكوين حقق أداءً يزيد بمقدار 35 مرة مقارنة بالجيل السابق، عند مستويات سعرية تتراوح بين 45 و150 دولارًا.

من منظور زمني أطول، يمكن لمركز بيانات واحد بقدرة 1 جيجاوات أن يزيد معدل إنتاج الرموز من 22 مليون في الثانية إلى 700 مليون خلال عامين.

نصائح Huang للعملاء هي: إذا كانت الأعمال تعتمد على استنتاج عالي الإنتاجية، فليستخدموا Vera Rubin بالكامل؛ وإذا كانت هناك حاجة للبرمجة والتفاعل في الوقت الحقيقي، فيمكن تخصيص 25% من قدرة مركز البيانات لـ Groq LPU.

قال Huang إن LPU من Groq، الذي يُنتج بواسطة Samsung، دخل مرحلة الإنتاج، ومن المتوقع أن يبدأ الشحن في الربع الثالث من هذا العام.

وفي جانب البرمجيات، أطلقت NVIDIA منصة الذكاء الاصطناعي للمؤسسات NemoClaw، التي تدعم مشروع OpenClaw المفتوح المصدر الذي حقق نموًا سريعًا على GitHub، حيث وصفها Huang بأنها بمثابة نظام تشغيل للحواسيب الذكية.

لكن استخدام OpenClaw مباشرة في بيئة الشركات يحمل مخاطر أمنية، لأنها قد تسمح للوكلاء بالوصول إلى البيانات الحساسة، وتنفيذ الشفرات، والتواصل مع الخارج. لذلك، أضافت NVIDIA طبقة أمان مؤسسية على OpenClaw، تسمى NemoClaw. أعلنت شركات مثل Adobe وSalesforce وSAP عن اعتماد أدوات تطوير الوكيل من NVIDIA.

أما خارطة الطريق، فتشير إلى أن الجيل التالي من معمارية Feynman، المتوقع طرحه في 2028، سيدعم لأول مرة كل من الاتصال عبر الكابلات النحاسية وCPO (تقنية دمج مكونات الاتصال الضوئي مباشرة في الشريحة).

كما يُحتفل هذا العام بمرور 20 عامًا على إطلاق منصة CUDA، التي تعتبر الركيزة الأساسية لنظام بيئة برمجيات NVIDIA. وفقًا لـ Huang، فإن 60% من أعمال NVIDIA تأتي من أكبر خمس مزودي خدمات سحابية عالميًا، و40% من مجالات أخرى مثل الذكاء الاصطناعي السيادي، والأعمال، والصناعة، والروبوتات.

وفي مؤتمر GTC، أعلنت NVIDIA أيضًا عن تعاون مع Uber وBYD وGeely وHyundai وNissan وIsuzu في مجال القيادة الذاتية. دفعت هذه الأخبار أسهم السيارات في سوق هونغ كونغ للارتفاع الجماعي في 17 مارس، حيث قفزت Geely (00175.HK) بأكثر من 5% خلال التداول، وأغلقت بزيادة 4.55%.

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.