Google оголосила про восьме покоління TPU 8t: деталі архітектури мережі рівня стійки

AIMPACT повідомлення, 16 травня (UTC+8), Google розкрив архітектурні деталі восьмого покоління TPU (TPU 8t), підключеного до мережі Virgo на рівні рами. Ця мережа використовує високонасичені комутатори та плоску двошарову безблокову топологію, що підвищує пропускну здатність мережі дата-центру у 4 рази порівняно з попередніми поколіннями, одна структура може підключати понад 134 000 чипів TPU 8t, забезпечуючи 47 Pb/s безблокової двонапрямної пропускної здатності та майже лінійне масштабування продуктивності понад 1,7K ExaFlops. Сам TPU 8t використовує топологію 3D кільця, один суперкаскад може масштабуватися до 9600 чипів, а також підтримує масштабування понад мільйон чипів через JAX і Pathways. Ключові технології включають прискорювач SparseCore, перекриття та балансування VPU/MXU, нативну підтримку FP4, а також інтегрований CPU на базі Arm Axion для усунення вузьких місць у хості. Цей дизайн орієнтований на еволюцію моделей штучного інтелекту від щільних великих мовних моделей до масштабних гібридних моделей експертів і архітектур, орієнтованих на інференцію. (Джерело: InFoQ)
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено