هل تتجه مؤتمر GTC الخاص بشركة إنفيديا نحو تحول في شرائح الذكاء الاصطناعي؟ وسائل الإعلام الأمريكية: ستعود وحدة المعالجة المركزية إلى مركز المسرح مرة أخرى

robot
إنشاء الملخص قيد التقدم

أحدث معالج Vera من إنفيديا

ذكرت شبكة فاينانشال تايمز أن معالج الرسوميات (GPU) من إنفيديا لطالما كان من أكثر الشرائح طلبًا في السوق، لكن ظهور الذكاء الاصطناعي بشكل مفاجئ أعاد إحياء مركزية معالج الحاسوب الرئيسي (CPU) الخاص بها، والذي كان أقل بروزًا.

الآن، تستعد إنفيديا للكشف عن تفاصيل جديدة حول معالج CPU الذي تم تحسينه خصيصًا للذكاء الاصطناعي، خلال مؤتمر GTC السنوي الذي يُفتتح يوم الاثنين، ومن المتوقع أن يتم عرض نموذج لرف من المعالجات يضم معالج CPU فقط في الجناح الخاص بها.

قال ديون هاريس، مدير بنية تحتية الذكاء الاصطناعي في إنفيديا، لـ CNBC هذا الأسبوع: “يبدأ المعالج المركزي في أن يصبح عنق الزجاجة في توسيع تدفقات عمل الذكاء الاصطناعي والوكيل الذكي.” ويعتقد أن هذا يمثل “فرصة مثيرة”.

أطلقت إنفيديا في عام 2021 أول معالج مركز بيانات لها، وهو Grace، وأصبح الجيل التالي Vera الآن في مرحلة الإنتاج. عادةً ما تُنشر هذه المعالجات مع وحدات معالجة الرسوم Hopper أو Blackwell أو Rubin الشهيرة من إنفيديا، ضمن أنظمة كاملة من نوع الرف.

أدى الطلب المتزايد على وحدات المعالجة الرسومية إلى جعل إنفيديا شركة معروفة عالميًا، وأصبحت أكبر شركة مدرجة من حيث القيمة السوقية، بقيمة تصل إلى 4.4 تريليون دولار. في فبراير من هذا العام، شهدت استراتيجية الشركة في مجال الشرائح تحولًا كبيرًا، حيث أبرمت إنفيديا اتفاقية طويلة الأمد مع Meta، تضمنت لأول مرة نشر معالجات Grace بشكل مستقل على نطاق واسع، مع خطة لنشر Vera بحلول عام 2027.

قالت إنفيديا لـ CNBC إن الآلاف من معالجات CPU المستقلة من إنفيديا تعمل أيضًا على تشغيل مراكز البيانات المتقدمة في تكساس والمختبر الوطني لوس ألاموس للحواسيب العملاقة.

الوكيل الذكي يعيد إحياء المعالجات المركزية

توقع بنك أوف أمريكا أن يتضاعف حجم سوق المعالجات المركزية أكثر من مرة، من 27 مليار دولار في 2025 إلى 60 مليار دولار في 2030. وخلال الربع الأخير، حققت إنفيديا أكثر من 62 مليار دولار من إيرادات مراكز البيانات، بزيادة سنوية قدرها 75%.

يعزى نهضة المعالجات المركزية إلى تغير جوهري في متطلبات الحوسبة: مع الانتشار الواسع للذكاء الاصطناعي، تتغير سيناريوهات الاستخدام من روبوتات الدردشة التي تعتمد على الأسئلة والأجوبة إلى تطبيقات الوكيل الذكي التي تركز على المهام.

على الرغم من أن وحدات معالجة الرسوم GPU مناسبة جدًا لتدريب وتشغيل نماذج الذكاء الاصطناعي، لأنها تحتوي على آلاف النوى الصغيرة التي تركز على تنفيذ عمليات حسابية ضخمة في وقت واحد، إلا أن المعالجات المركزية تحتوي على عدد أقل من النوى عالية الأداء، ويمكنها تنفيذ مهام عامة بشكل متواصل.

يحتاج الوكيل الذكي إلى قدر هائل من القدرة الحاسوبية العامة، لأنه يتطلب نقل ومعالجة كميات هائلة من البيانات ضمن تدفقات عمل الذكاء الاصطناعي، والتنسيق والجدولة بين العديد من الوكلاء.

جينسن هوانغ

قال جيفن هوانغ، الرئيس التنفيذي لإنفيديا، خلال مؤتمر الأرباح الشهر الماضي: “تتطور أنظمة الوكيل الذكي إلى أنواع مختلفة من الوكلاء، التي تعمل بشكل متناسق كفريق واحد. لقد زاد عدد الرموز (tokens) التي يتم توليدها بشكل أسي، لذلك نحتاج إلى إجراء استنتاجات بسرعة أكبر.”

ذكر هوانغ مرارًا وتكرارًا خلال المؤتمر أن الذكاء الاصطناعي الوكيل الذكي هو من بين الموضوعات التي يركز عليها، وأكد أن “الأولوية القصوى في ظل تغير متطلبات الأجهزة هي الأداء لكل واط.”

أفادت إنفيديا في بيان صحفي أن معالجاتها المستقلة أدت إلى تحسين كبير في الأداء لكل واط في مراكز بيانات Meta. وقال بن بايارين، محلل الشرائح في Creative Strategies: “هذه بنية تحتية جديدة تمامًا: رفوف المعالجات المركزية الخالصة التي تركز فقط على تشغيل الوكيل الذكي. ستظل برامجك في مكان آخر، ومعالجاتك المسرعة تتولى معالجة الرموز، ولكن هناك حاجة إلى طبقة وسيطة للتنسيق والجدولة.”

أزمة توريد المعالجات

اليوم، يواجه سوق المعالجات المركزية، الذي كان في حالة ركود، ما وصفته شركة الاستشارات The Futurum Group بـ"أزمة إمداد هادئة". وتتوقع أن يتجاوز معدل نمو سوق المعالجات المركزية في عام 2028 نمو سوق وحدات المعالجة الرسومية.

ذكرت رويترز أن أكبر مزودي المعالجات، AMD وIntel، أطلقوا تحذيرات بشأن نقص الإمدادات للعملاء في الصين. وأشارت إلى أن فترات تسليم المعالجات تصل إلى ستة أشهر، وأن الأسعار ارتفعت بأكثر من 10%.

قال فوريست نورود، مدير مركز البيانات في AMD، في مقابلة مع CNBC: “خلال الأشهر الستة إلى التسعة الماضية، شهد الطلب نموًا غير مسبوق.” وأضاف أن الطلب على المعالجات لن يتراجع على المدى القصير، لكنه يتوقع أن يواصل النمو، وأن AMD تعمل على “تكثيف جهودها” لتلبية الطلب.

قال متحدث باسم Intel لـ CNBC إن الشركة تتوقع أن تصل مخزوناتها في الربع الحالي إلى “نقطة أدنى”، مضيفًا: “نحن نعمل بنشاط، ونتوقع أن يتحسن العرض تدريجيًا من الربع الثاني وحتى نهاية عام 2026.”

قال بن بايارين، محلل الشرائح في Creative Strategies: “الرقائق لا تنمو على الأشجار. لا يمكننا أن نحصل على 10% إضافية من السيليكون من الرقائق بشكل عشوائي. القطاع بأكمله يواجه ضغوطًا في الإمداد، لذلك، للأسف، فإن إمدادات الرقائق من السيليكون محدودة.”

عند سؤاله عما إذا كانت إنفيديا ستواجه تأخيرًا في شحن المعالجات، قال هاريس، مدير بنية تحتية الذكاء الاصطناعي: “كل شيء على ما يرام في الوقت الحالي.”

وأضاف أن إنفيديا تمتلك “سلسلة إمداد قوية”، تمكنها من تلبية الطلب، ويعزى ذلك بشكل كبير إلى أن الشركة تبيع العديد من المعالجات المركزية مع وحدات معالجة الرسوم ضمن أنظمة الرفوف.

تصميم مخصص لوحدات معالجة الرسوم

قال هاريس إن إنفيديا تتبع نهجًا مختلفًا تمامًا في تصميم معالجاتها، مقارنةً مع إنتل وAMD، حيث تجعل معالجاتها “الأكثر ملاءمة” لمعالجة البيانات وتدفقات العمل للوكيل الذكي.

واحدة من الاختلافات الرئيسية هي عدد النوى في كل معالج. عادةً ما تحتوي معالجات الخوادم عالية الأداء من AMD وIntel على 128 نواة، بينما معالج Grace من إنفيديا يحتوي على 72 نواة.

معالج خادم AMD EPYC

شرح هاريس: “إذا كنت شركة سحابية ضخمة، فستريد تعظيم عدد النوى في كل معالج، وهو في الأساس لتقليل التكاليف، أي تكلفة النواة.” وأضاف أن هذا يمثل نموذجًا تجاريًا.

لكن، صممت إنفيديا معالجاتها خصيصًا لدعم وحدات معالجة الرسوم GPU في تشغيل أحمال العمل الخاصة بالذكاء الاصطناعي. وقال هاريس: “في هذه الحالة، الأداء الأحادي للنواة أهم من تكلفة كل نواة، لأنك تريد ضمان أن لا تظل موارد GPU المكلفة جدًا عاطلة عن العمل.”

كما تعتمد معالجات إنفيديا على بنية ARM، التي تُستخدم غالبًا في الهواتف الذكية والأجهزة منخفضة استهلاك الطاقة، بينما تعتمد معالجات إنتل وAMD على بنية x86 التقليدية، التي أطلقتها إنتل قبل حوالي 50 عامًا، وظلت تهيمن على تصميم معالجات الحواسيب الشخصية والخوادم منذ ذلك الحين.

قال نورود، مدير مركز البيانات في AMD: “أعتقد أن إنفيديا قد حسنت بشكل كبير من أداء شرائحها لدعم الحوسبة عبر وحدات معالجة الرسوم، لكنها لم تُحسن بشكل جيد لتطبيقات عامة.”

وفي الواقع، تعتمد إنفيديا على معالجات مركزية أكثر عمومية في بعض منتجاتها، مثل منصة HGX Rubin NVL8، حيث تربط وحدات معالجة الرسوم الخاصة بها بمعالجات إنتل أو AMD الرئيسية، لاستخدامها كأساس لبناء رفوف الذكاء الاصطناعي الخاصة بالعملاء.

مع دخول إنفيديا سوق المعالجات المركزية المستقلة، يزداد عدد عملائها الذين يطورون معالجات تعتمد على بنية ARM لمراكز البيانات الخاصة بهم.

أمازون كانت أول شركة سحابية ضخمة تطلق معالجها الخاص، حيث أطلقت معالج Graviton في 2018. وذكرت شركة The Futurum Group أن شركة جوجل أطلقت معالج Axion في 2024، ويعمل الآن على حوالي 30% من تطبيقاتها الداخلية. وأطلقت مايكروسوفت في نوفمبر من العام الماضي الجيل الثاني من معالج Cobalt. ومن المتوقع أن تطلق ARM معالجها الخاص هذا العام، وأن تكون Meta من أوائل عملائها.

تقدر شركة الأبحاث Mercury Research أن حصة سوق معالجات الخوادم في الربع الرابع من 2025 ستكون بقيادة إنتل بنسبة 60%، تليها AMD بنسبة 24.3%، وإنفيديا بنسبة 6.2%، بينما تشغل الشركات السحابية الكبرى مثل أمازون ومايكروسوفت وجوجل المعالجات التي تعتمد على بنية ARM، والتي تطورها ذاتيًا. (المؤلف/شياو يو)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت