أطلقت جوجل الدليل التدريبي للمطورين للجيل السابع من وحدة معالجة Tensor Ironwood، مع شرح مفصل لتحسين الأداء على مستوى النظام

robot
إنشاء الملخص قيد التقدم

أخبار ME، في 2 أبريل (بتوقيت UTC+8)، أصدرت شركة جوجل مؤخرًا دليل تدريب للمطورين موجه إلى معالج TPU من الجيل السابع Ironwood. يهدف هذا الدليل إلى مساعدة المطورين على الاستفادة الكاملة من الأداء على مستوى النظام لمعالج Ironwood TPU، من أجل تدريب ونشر نماذج الذكاء الاصطناعي المتطورة بكفاءة عالية. يُعد معالج Ironwood TPU بنية أساسية مخصصة للذكاء الاصطناعي مصممة لتلبية متطلبات حسابات النماذج ذات المليارات من المعاملات، حيث يستخدم تقنيات مثل الربط بين الشرائح (ICI)، ومفاتيح التبديل الضوئية (OCS)، وشبكة مراكز البيانات (DCN)، وذاكرة عالية النطاق الترددي (HBM) المجمعة لبناء نظام كامل يدعم حتى 9,216 شريحة. يشرح المقال بالتفصيل العديد من استراتيجيات التحسين الرئيسية لهذا العتاد، بما في ذلك: الاستفادة من وحدة الضرب المصفوفي (MXU) لدعم تدريب FP8 بشكل أصلي لزيادة الإنتاجية؛ استخدام مكتبة النوى JAX المصممة خصيصًا لـ TPU، Tokamax، لمعالجة النصوص الطويلة والنماذج المختلطة باستخدام “الانتباه المتطاير” و"مصفوفة المجموعات Megablox"؛ استغلال النواة المجهرية المتفرقة من الجيل الرابع (SparseCore) لتحميل عمليات الاتصال الجماعي لإخفاء التأخير؛ تحسين تخصيص ذاكرة SRAM على المعالج (VMEM) بسرعة TPU لتقليل توقف الذاكرة؛ واختيار استراتيجية التقسيم المثلى (مثل FSDP، TP، EP) استنادًا إلى حجم النموذج، والهندسة المعمارية، وطول التسلسل. (المصدر: InFoQ)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.31Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.29Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.29Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.32Kعدد الحائزين:1
    0.29%
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • تثبيت