أطلقت جوجل الدليل التدريبي للمطورين للجيل السابع من وحدة معالجة Tensor Ironwood، مع شرح مفصل لتحسين الأداء على مستوى النظام

robot
إنشاء الملخص قيد التقدم

أخبار ME News، في 2 أبريل (بتوقيت UTC+8)، أصدرت جوجل مؤخرًا دليل تدريب للمطورين يستهدف معالج Ironwood TPU من الجيل السابع. يهدف هذا الدليل إلى مساعدة المطورين على الاستفادة الكاملة من الأداء على مستوى النظام لـ Ironwood TPU، من أجل تدريب ونشر نماذج الذكاء الاصطناعي المتقدمة بكفاءة. يُعد Ironwood TPU بنية أساسية مخصصة للذكاء الاصطناعي مصممة لتلبية متطلبات حسابات نماذج ذات تريليونات المعاملات، حيث يستخدم تقنيات مثل الربط بين الشرائح (ICI)، والمبدّل الضوئي لمسارات الإرسال (OCS)، وشبكة مراكز البيانات (DCN)، وذاكرة عالية النطاق الترددي مجمّعة (HBM) لبناء نظام كامل يدعم ما يصل إلى 9,216 شريحة. يشرح المقال بالتفصيل عدة استراتيجيات تحسين رئيسية لهذا العتاد، بما في ذلك: استخدام وحدة الضرب المصفوفي (MXU) التي تدعم تدريب FP8 بشكل أصلي لزيادة الإنتاجية؛ واعتماد مكتبة نوى JAX المخصصة للـ TPU Tokamax، من خلال “الانتباه المتطاير” و"Megablox تجميع الضرب المصفوفي ضمن مجموعات" للتعامل مع التلافيف غير المنتظمة في نماذج السياقات الطويلة ونماذج الخبراء المختلطة؛ واستغلال النواة المتفرعة من الجيل الرابع (SparseCore) لتفريغ عمليات الاتصالات الجماعية وإخفاء التأخير؛ وضبط توزيع ذاكرة SRAM السريعة على الشريحة الخاصة بـ TPU (VMEM) بدقة لتقليل تعطل الذاكرة؛ وكذلك اختيار أفضل استراتيجية للتقسيم وفقًا لحجم النموذج والبنية وطول التسلسل (مثل FSDP وTP وEP). (المصدر: InFoQ)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت