أطلقت جوجل الجيل الثامن من وحدة المعالجة التنسيلية TPU 8t، تفاصيل بنية الشبكة على مستوى الحاوية

robot
إنشاء الملخص قيد التقدم
رسالة AIMPACT، 16 مايو (UTC+8)، كشفت جوجل عن تفاصيل بنية الاتصال على مستوى الرف للجيل الثامن من TPU (TPU 8t) لشبكة Virgo. تعتمد الشبكة على مفاتيح تبادل عالية القاعدة وطوبولوجيا مسطحة من طبقتين بدون عوائق، مما يزيد عرض النطاق الترددي لشبكة مركز البيانات إلى أربعة أضعاف الجيل السابق، ويمكن للهيكل الواحد أن يتصل بأكثر من 134,000 شريحة TPU 8t، ويوفر عرض نطاق غير عائق ثنائي الاتجاه قدره 47 بيتابت في الثانية وأداء يتجاوز 1.7 ألف إكسا فلوبس بتوسع شبه خطي. يستخدم TPU 8t نفسه طوبولوجيا حلقة ثلاثية الأبعاد، ويمكن أن يتوسع حاوية سوبر واحدة إلى 9600 شريحة، ويدعم التوسع إلى أكثر من مليون شريحة عبر JAX و Pathways. تشمل التقنيات الرئيسية معجل SparseCore، تراكب وتوازن VPU/MXU، دعم أصلي لـ FP4، ودمج معالج Axion المستند إلى ARM لإزالة عنق الزجاجة في المضيف. يهدف هذا التصميم إلى تطور نماذج الذكاء الاصطناعي من نماذج اللغة الكبيرة المكثفة إلى نماذج الخبراء المختلطة واسعة النطاق والهياكل المعتمدة على الاستنتاج المكثف. (المصدر: InFoQ)
GOOGLX0.51%
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 5
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
L2LunchBoy
· منذ 6 س
هل يمكن أن يحافظ تدريب دقة FP4 على الاستقرار، أم أنه مخصص فقط للاستخدام في الاستنتاج؟
شاهد النسخة الأصليةرد0
NeonIceMelt
· منذ 6 س
13.4 مليون بنية شرائح، كيف يتم تقسيم مجال العطل هو علم بحد ذاته
شاهد النسخة الأصليةرد0
LatencyLullaby
· منذ 7 س
يدعم SparseCore و FP4 بشكل أصلي، هل تقوم جوجل بضغط تكلفة الاستدلال إلى أقصى حد؟
شاهد النسخة الأصليةرد0
GateUser-ebdc7d3a
· منذ 7 س
وحدة صاروخية واحدة عالية الأداء 9600 شريحة، كيف يتم تبديد الحرارة بكثافة كهذه، أنا فضولي جدًا
شاهد النسخة الأصليةرد0
ByteBard
· منذ 7 س
دمج معالج Arm Axion، وأصبح الحوسبة غير المتجانسة أكثر احترافًا.
شاهد النسخة الأصليةرد0
  • مُثبت