Google выпустила восьмое поколение TPU: детали архитектуры сетевого оборудования уровня 8t

robot
Генерация тезисов в процессе
AIMPACT сообщение, 16 мая (UTC+8), Google раскрыла архитектурные детали восьмого поколения TPU (TPU 8t), подключенного к сети Virgo на уровне рамы. Эта сеть использует высоко-кастовые коммутаторы и плоскую двухуровневую безблоковую топологию, увеличивая пропускную способность сети дата-центра в 4 раза по сравнению с предыдущим поколением, один узел может подключать более 134 000 чипов TPU 8t, обеспечивая 47 Pb/s безблоковой двунаправленной пропускной способности и почти линейную масштабируемость производительности свыше 1,7K ExaFlops. Сам TPU 8t использует топологию 3D кольцевого типа, один суперкабель может масштабироваться до 9600 чипов, а также поддерживает расширение через JAX и Pathways до более чем 1 миллиона чипов. Ключевые технологии включают ускоритель SparseCore, перекрытие и балансировку VPU/MXU, нативную поддержку FP4, а также интегрированный CPU на базе Arm Axion для устранения узких мест в хосте. Этот дизайн ориентирован на эволюцию моделей ИИ от плотных больших языковых моделей к крупномасштабным гибридным экспертным моделям и архитектурам, ориентированным на вывод. (Источник: InFoQ)
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 10
  • 2
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
GateUser-1bc81bb2
· 33м назад
От TPU v4 до 8t — такой темп развития не дает NVIDIA уснуть.
Посмотреть ОригиналОтветить0
GateUser-bf5d0c14
· 2ч назад
Модульная сеть с межсоединением Virgo, плоский двухуровневый без блокировок, эти технические детали достаточно крутые
Посмотреть ОригиналОтветить0
BlackVelvetKey
· 3ч назад
SparseCore и FP4 нативная поддержка, насколько можно снизить затраты на обучение?
Посмотреть ОригиналОтветить0
AuroraSnowyWildernessSolitary
· 3ч назад
47Pb/s не блокирующая пропускная способность действительно впечатляет, дизайн сети Google, похоже, ориентирован на достижение AGI, да?
Посмотреть ОригиналОтветить0
GateUser-f78f1f3e
· 6ч назад
Миллион расширений чипов, экосистема JAX/Pathways связана слишком плотно.
Посмотреть ОригиналОтветить0
CatUnderTheNeonBridge
· 6ч назад
13.4万芯片单结构,这规模AWS看了沉默,Azure看了流泪
Посмотреть ОригиналОтветить0
AirdropJanitor
· 6ч назад
Arm Axion CPU интегрирован, TPU тоже пойдет по пути SoC
Посмотреть ОригиналОтветить0
AprDaydream
· 6ч назад
Оптимизация, специально предназначенная для архитектуры MoE, похоже, что Gemini следующего поколения собирается устроить что-то грандиозное
Посмотреть ОригиналОтветить0
AirdropArchivist
· 6ч назад
VPU/MXU перекрестное балансирование, Google наконец-то разобрался с управлением вычислительными блоками
Посмотреть ОригиналОтветить0
QuantitativeButNotPretentious
· 6ч назад
Однопоршневая суперкабина 9600 чип, как решается вопрос охлаждения? Интересуюсь.
Посмотреть ОригиналОтветить0
Подробнее
  • Закреплено