"جيل جديد من الذكاء الاصطناعي" من GPU إلى LPU: شركة نيفيديا تهاجم بشكل كبير شرائح الاستدلال، و Jensen Huang يحقق خطوة حاسمة مرة أخرى

robot
إنشاء الملخص قيد التقدم

「AI新世代」从GPU到LPU:英伟达大举进攻推理芯片市场,黄仁勋再落关键一子

3月17日凌晨,在GTC 2026上,英伟达CEO黄仁勋亮出新武器——Groq 3 LPU,大举进攻推理芯片市场。

AI产业的风向变了。前几年,所有人都在拼命“训模型”——把数据喂给GPU,等它长出智能,那时候,英伟达的GPU是唯一的王,谁也撼不动,但这两年,智能体成群结队地涌向市场,Manus出圈,OpenClaw刷屏,模型厂商和云服务商开始靠卖token赚钱,Cerebras们举着“更快、更便宜”的旗号,在英伟达霸占多年的版图上撕口子。

业界终于意识到:训练还在继续,但“推理”已经成为主流。英伟达自然不会错失这一市场机遇,推理这块蛋糕,它也要切一刀。3月17日凌晨,在GTC 2026上,英伟达CEO黄仁勋亮出新武器——Groq 3 LPU,大举进攻推理芯片市场。同时他甩出一组数字:到2027年底,Blackwell和Rubin两条产品线的年收入将达1万亿美元,比半年前的预测翻了一倍。

训练推理两手抓

这次英伟达正式推出Vera Rubin平台,共搭载7款芯片,分别是Rubin GPU、Vera CPU、ConnectX-9 SuperNIC、BlueField-4 DPU、NVLink 6 Switch、Spectrum-X 102.4T CPO,以及新集成的Groq 3 LPU。

“LPU”全称为“Language Processing Unit”,即 وحدة معالجة اللغة، هي شريحة تسريع مخصصة لاستنتاج الذكاء الاصطناعي. Rubin GPU ستدمج مع Groq LPU، لترفع معدل الإنتاجية من 100 token في الثانية إلى 1500 token في الثانية أو أكثر، بما يتيح دعمًا مثاليًا لسيناريوهات تفاعل وكلاء الذكاء الاصطناعي.

كما أطلقت إنفيديا منصة رف كاملة مخصصة لاستيعاب مُسرّعات Groq الجديدة — Groq LPX. ووفقًا لما ذكره نائب رئيس إنفيديا للكفاءة الفائقة والحوسبة عالية الأداء Ian Buck، فإن Groq LPX سيرفع أداء فك التشفير لـ“النموذج الذكاء الاصطناعي لكل طبقة على كل token”، كما ستمكّن Rubin من خدمة المجال الرائد التالي للذكاء الاصطناعي: أنظمة متعددة الوكلاء، التي تحتاج إلى تقديم أداء تفاعلي داخل نوافذ سياق تضم ملايين الـtokens، بالتزامن مع نماذج تحتوي على تريليونات من المعلمات في مرحلة الاستنتاج.

إن شغف إنفيديا بسوق شرائح الاستنتاج لم يبدأ اليوم، بل سبق أن كانت تستعد له. ففي ديسمبر 2025، اشترت الشركة أصولًا تقنية أساسية من Groq بحوالي 20 مليار دولار، وانضم مؤسسها إلى إنفيديا، وكانت Groq 3 LPU أول نتيجة منشورة علنًا بعد عملية الاستحواذ هذه.

بناءً على توقعات نموذجية من قسم أبحاث الاستثمار العالمي التابع لـGoldman Sachs، فإن حصة الشحن من شرائح غير GPGPU ضمن شرائح شرائح الذكاء الاصطناعي في خوادم الذكاء الاصطناعي ستُظهر اتجاهًا صاعدًا واضحًا؛ إذ يُتوقع أن ترتفع من 36% في 2024 تدريجيًا إلى 45% في 2027، بينما يُتوقع أن تنخفض حصة شحن شرائح GPGPU من 64% في 2024 تدريجيًا إلى 55% في 2027.

قدّم Qin Fengwei، محلّل أول في InSemi Research، شرحًا للمراسل بهذا الخصوص، مشيرًا إلى أن GPU ستكون أكثر قدرة على المنافسة في قواعد نماذج الأساس للتدريب على نطاق واسع، وفي سيناريوهات تتطلب متطلبات أعلى للعمومية (مثل السحابة العامة)، وكذلك في سيناريوهات الحوسبة المتوازية؛ بينما تكون ASIC (بما في ذلك TPU وDPU وNPU وLPU وغيرها) أكثر ميزة نسبيًا في مرحلة نشر النماذج، وفي سيناريوهات الاستنتاج، لأن هذه السيناريوهات تتطلب كفاءة طاقة أعلى وزمن استجابة أقل.

“لذلك، عندما تطلق إنفيديا LPU، فإنها تضع تخطيطًا استراتيجيًا لمواجهة التحول في احتياجات الحوسبة من ‘التدريب’ إلى ‘الاستنتاج’، وهذه خطوة محورية لسد الفجوات. إنها تستخدم تخطيطًا منتجيًا أكثر تفصيلًا للاستجابة لتغيرات السوق وتحديات المنافسين.” قال Zhang Xiaorong، رئيس معهد أبحاث Deep Tech، للمراسل.

据媒体报道,إن计划 إنفيديا للتعامل مع الطلب المتزايد على الاستنتاج قد عاد عليها بعوائد. وفي الشهر الماضي، أعلنت OpenAI أنها توصلت إلى اتفاق مع إنفيديا لشراء شرائح تمتلك “قدرات استنتاج مخصصة”.

ترقية النظام البيئي من الشريحة إلى المصنع

خلال السنوات القليلة الماضية، أشعل الذكاء الاصطناعي التوليدي السوق، وأصبح تدريب نماذج اللغات الكبيرة هو بئر السوادن من حيث استهلاك القدرة الحوسبية، ومع الهيمنة المطلقة للـGPU، حصلت إنفيديا على معظم عوائد هذه الموجة، فتقفزت أداؤها المالي وقيمتها السوقية على حد سواء، حتى امتلأت الأرباح في كل الاتجاهات.

ومع ذلك، ومع دخول منافسة عدد معلمات النماذج إلى مرحلة تناقص العوائد الحدّية، تباطأ تدريب نماذج اللغات الكبيرة أخيرًا بعد جري عامين. ابتداءً من عام 2025، بدأ محور المنافسة بالانحراف — حيث صعدت الوكلاء والهندسة السياقية إلى واجهة المشهد. والإشارة الأكثر مباشرة هي: أن OpenClaw سيطرت على منصات التواصل الاجتماعي؛ إذ اخترقت دائرة “التكنولوجيا” وصولًا إلى تيار المعلومات لدى عامة الناس.

تُعد الوكلاء عاملًا رئيسيًا يساعد على نمو الطلب في سوق الاستنتاج؛ إذ تركز سيناريوهاتها الأساسية على الاستنتاج أكثر من التدريب. وقد دعمت هذا الرأي أبحاثٌ رسمية متعددة وتحليلاتٌ صناعية، لذلك، عندما تطورت قدرات الذكاء الاصطناعي من مرحلة تدريب نماذج الأساس إلى مرحلة الوكلاء التي تركز على بناء سير العمل، انتقلت نقطة ثقل احتياجات الحوسبة من التدريب إلى الاستنتاج.

وباعتبار إنفيديا لاعبها الأبرز ضمن البنية التحتية للذكاء الاصطناعي، فمن الطبيعي أن تتغير بما يتوافق مع اتجاهات السوق، بل وعلى مستوى منظومة النظام البيئي بأكملها.

في هذا المؤتمر GTC، بالإضافة إلى إطلاق LPU، نسّقت إنفيديا أيضًا مع فريق يقوده Peter Steinberger، مؤسس OpenClaw، وضمّت مجموعة من خبراء الأمن والحوسبة على مستوى القمة، لإطلاق مرجعية النظام NeMoClaw؛ حيث يتضمن OpenShell، وآليات حماية الشبكة، وقدرة توجيه الخصوصية، ما يتيح للشركات تشغيل أنظمة الوكلاء بأمان داخل بيئاتها الخاصة.

بل إن إنفيديا أطلقت أيضًا تصميمًا مرجعيًا لمصنع Vera Rubin DSX AI؛ لتعليم كيفية تصميم وبناء وتشغيل مكدس البنية التحتية لمصنع ذكاء اصطناعي كامل، يشمل الحوسبة وشبكة NVIDIA Spectrum-XEthernet والتخزين، من أجل تحقيق أداء عنقودي متكرر وقابل للتوسع وذو كفاءة مثلى.

وقال Huang Renxun: “في عصر الذكاء الاصطناعي، تُعد tokens الذكية عملة جديدة، ويُعد مصنع الذكاء الاصطناعي هو البنية التحتية التي تُنتج هذه الـtokens. ومن خلال تصميم Vera Rubin DSX AI Factory المرجعي وBlueprint Omniverse DSX (المخطط التوأمي الرقمي)، نحن نوفر الأساس لبناء مصانع AI عالية الإنتاجية في العالم، مع تسريع وقت تحقيق الإيرادات الأولى، وتعظيم الحجم وكفاءة الطاقة.”

أما بالنسبة لكيف سيتغير توزيع حصة GPU الرائدة لدى إنفيديا بعد إطلاق LPU، فقد قام مراسل صحيفة “Huaxia Times” بإجراء مقابلة مع جهة إنفيديا بهذا الشأن، لكن حتى وقت إعداد هذا التقرير لم يتم استلام رد. “إن دخول إنفيديا إلى سوق شرائح الاستنتاج لا يعني أن أعمال GPU ستتضرر نتيجة لذلك؛ بل على العكس، ستُفتح أمامها مساحات سوقية أوسع في إطار التعاون والتكامل مع LPU.” قال Zhang Xiaorong.

أشار خبيرٌ مُعيّن من معهد Zhican Zhiku، Yuan Bo، إلى أنه على المدى القصير، ستستمر GPU في قيادة السوق بفضل قدرتها القوية على التكيف مع السيناريوهات وحواجز النظام البيئي، خصوصًا في سيناريوهات تدريب الذكاء الاصطناعي؛ وعلى المدى الطويل، فإن المسارين ليسا على طرفي نقيض تمامًا، بل سيتجهان نحو الاندماج وتقسيم السوق. “على مستوى العتاد، ستقوم GPU بدمج نوى مخصصة أقوى، كما ستعمل الشرائح المخصصة على زيادة قابلية البرمجة. ومن المتوقع في السوق أن يتشكل نمط طبقي يتمثل في أن تقود كل من الابتكار المهيمن والمنصة العامة على جانب GPU، بينما تتخصص الشرائح المخصصة في التوسع والتمكين على نطاق واسع للاستنتاج.”

在 سوق ASIC، هناك بالفعل مجموعة من منافسي إنفيديا المتواجدين، بما في ذلك Cerebras في الخارج، وCambrian في الصين، وHuawei، وSiYuan Technology وغيرهم. واعتبر Zhang Xiaorong أن دخول إنفيديا إلى مجال شرائح الاستنتاج يمثل تحديًا ومحفزًا للشركات المحلية في الوقت ذاته؛ إذ سيتشكل وضع معقد يتعايش فيه “الضغط” مع “الإجبار على اللحاق”، ما سيُسرّع إعادة تشكيل الصناعة وترقية التكنولوجيا.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.27Kعدد الحائزين:2
    0.00%
  • القيمة السوقية:$2.37Kعدد الحائزين:2
    1.04%
  • القيمة السوقية:$2.24Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.24Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.25Kعدد الحائزين:1
    0.00%
  • تثبيت