أطلقت جوجل الجيل الثامن من وحدة المعالجة التنسيلية TPU 8t، تفاصيل بنية الشبكة على مستوى الخادم

robot
إنشاء الملخص قيد التقدم
رسالة AIMPACT، 16 مايو (بتوقيت UTC+8)، كشفت جوجل عن تفاصيل بنية الاتصال على مستوى الرف للجيل الثامن من TPU (TPU 8t) لشبكة Virgo. تعتمد الشبكة على مفاتيح تبادل عالية القاعدة وطوبولوجيا مسطحة من طبقتين بدون عوائق، مما يرفع عرض النطاق الترددي لشبكة مركز البيانات إلى أربعة أضعاف الجيل السابق، ويمكن للهيكل الواحد أن يتصل بأكثر من 134,000 شريحة TPU 8t، ويوفر عرض نطاق ترددي غير عائق ثنائي الاتجاه يبلغ 47 بيتابايت في الثانية وأداء يتجاوز 1.7 ألف إكسا فلوبس بتوسع شبه خطي. يستخدم TPU 8t نفسه طوبولوجيا حلقة ثلاثية الأبعاد، ويمكن أن يتوسع حاوية سوبر واحدة إلى 9600 شريحة، ويدعم التوسع إلى أكثر من مليون شريحة عبر JAX و Pathways. تشمل التقنيات الرئيسية معجل SparseCore، تراكب وتوازن VPU/MXU، دعم أصلي لـ FP4، ودمج معالج Axion المستند إلى ARM لإزالة عنق الزجاجة في المضيف. يهدف هذا التصميم إلى تلبية تطور نماذج الذكاء الاصطناعي من نماذج اللغة الكبيرة المكثفة إلى نماذج الخبراء المختلطة واسعة النطاق والهياكل المعتمدة على الاستنتاج المكثف. (المصدر: InFoQ)
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 11
  • 3
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
GateUser-8df0eb2b
· منذ 3 س
شريحة وحدة الكبسولة الفائقة 9600 يمكن توسيعها إلى مليون وحدة، هذا الحجم لو فكرت فيه العام الماضي لما كنت تتخيله
شاهد النسخة الأصليةرد0
PerpNightwatch
· منذ 4 س
يدعم FP4 الأصلي، ويمكن تقليل ضغط الذاكرة ووحدة المعالجة، وانخفضت تكلفة الاستدلال بشكل كبير
شاهد النسخة الأصليةرد0
GateUser-14cb5f72
· منذ 4 س
1.7K إكسا فلوبس توسع خطي تقريبًا، هذا الرقم يبدو كأنه من خيال علمي
شاهد النسخة الأصليةرد0
TheNemesisOfFomo
· منذ 4 س
مسارات + JAX يرسخان بيئتهما بشكل متزايد، جوجل تبني حصنها الخاص
شاهد النسخة الأصليةرد0
OpcodePoet
· منذ 4 س
مفتاح التبديل ذو القاعدة العالية، تصميم شبكة مسطحة، هل يمكن لمركز البيانات أن ينسخ هذا النهج؟
شاهد النسخة الأصليةرد0
ChillBlock
· منذ 5 س
من التحول من نماذج اللغة الضخمة إلى بنية MoE + الاستدلال، اتجاه الصناعة سيتغير
شاهد النسخة الأصليةرد0
Don'tCallMeABagHolder.
· منذ 5 س
هل تسمية TPU 8t تعني أن الجيل التالي سيكون 9t، 10t، مباشرةً مواكبة لوتيرة تحديث إنفيديا؟
شاهد النسخة الأصليةرد0
StardustUnderTheGlassDome
· منذ 5 س
عرض النطاق الترددي للاتصال بين الرقائق يضاعف أربع مرات، وتخفف عنق الزجاجة في الاتصالات، ويمكن أن ترتفع كفاءة المعالجة المتوازية للنماذج الكبيرة
شاهد النسخة الأصليةرد0
RedGlass
· منذ 5 س
كيف يتم التعامل مع معدل فشل تجمع مئات الآلاف من الرقائق، أنا فضولي حول آليات التحمل الخاصة بهم
شاهد النسخة الأصليةرد0
ShortPositionsAtTheElevator
· منذ 5 س
تصميم SparseCore و VPU/MXU المتداخل مثير للاهتمام، وأشعر أنه يمهد الطريق لهندسة MoE
شاهد النسخة الأصليةرد0
عرض المزيد
  • مُثبت