أطلقت جوجل الدليل التدريبي للمطورين للجيل السابع من وحدة معالجة Tensor Ironwood، مع شرح مفصل لتحسين الأداء على مستوى النظام

robot
إنشاء الملخص قيد التقدم

أخبار ME News، في 2 أبريل (بتوقيت UTC+8)، أصدرت جوجل مؤخرًا دليل تدريب للمطورين موجه إلى معالج Ironwood TPU من الجيل السابع. يهدف هذا الدليل إلى مساعدة المطورين على الاستفادة الكاملة من الأداء على مستوى النظام لـ Ironwood TPU، من أجل تدريب ونشر نماذج الذكاء الاصطناعي المتقدمة بكفاءة. يُعد Ironwood TPU بنية أساسية مخصصة للذكاء الاصطناعي مصممة لتلبية متطلبات حسابات نماذج ذات تريليونات المعاملات، حيث يستخدم تقنيات مثل الربط بين الرقائق (ICI)، والمفاتيح الضوئية (OCS)، وشبكة مراكز البيانات (DCN)، وذاكرة عالية النطاق الترددي المجمعة (HBM) لبناء نظام كامل يدعم حتى 9,216 رقاقة. يشرح المقال بالتفصيل العديد من استراتيجيات التحسين الرئيسية لهذا العتاد، بما في ذلك: الاستفادة من وحدة الضرب المصفوفي (MXU) لدعم تدريب FP8 بشكل أصلي لزيادة الإنتاجية؛ اعتماد مكتبة نوى JAX المصممة خصيصًا لـ TPU، Tokamax، لمعالجة النصوص الطويلة والنماذج المختلطة باستخدام “الانتباه المتطاير” و"ضرب المصفوفة المجمع في Megablox"؛ استخدام النواة المجزأة من الجيل الرابع (SparseCore) لتحميل عمليات الاتصال الجماعي لإخفاء التأخير؛ تحسين تخصيص ذاكرة SRAM السريعة على الرقاقة (VMEM) بدقة لتقليل توقف الذاكرة؛ واختيار استراتيجية التقسيم المثلى (مثل FSDP، TP، EP) استنادًا إلى حجم النموذج، والهندسة المعمارية، وطول السلسلة. (المصدر: InFoQ)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.29Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.32Kعدد الحائزين:1
    0.29%
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.29Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.32Kعدد الحائزين:2
    0.00%
  • تثبيت