Google merilis arsitektur jaringan rack-level generasi kedelapan TPU 8t detail

robot
Pembuatan abstrak sedang berlangsung
Pesan AIMPACT, 16 Mei (UTC+8), Google mengungkapkan detail arsitektur koneksi rak ke jaringan Virgo dari TPU generasi kedelapan (TPU 8t).
Jaringan ini menggunakan switch dengan basis tinggi dan topologi dua lapis datar tanpa hambatan, meningkatkan bandwidth jaringan pusat data hingga 4 kali lipat dari generasi sebelumnya, satu struktur dapat menghubungkan lebih dari 134.000 chip TPU 8t, menyediakan bandwidth dua arah non-hambatan sebesar 47 Pb/s dan performa hampir linear dengan lebih dari 1,7K ExaFlops.
TPU 8t sendiri menggunakan topologi cincin 3D, satu pod super dapat diperluas hingga 9600 chip, dan mendukung ekspansi melalui JAX dan Pathways hingga lebih dari satu juta chip.
Teknologi kunci termasuk akselerator SparseCore, tumpang tindih dan penskalaan seimbang VPU/MXU, dukungan native FP4, serta integrasi CPU berbasis Arm Axion untuk menghilangkan bottleneck host.
Desain ini ditujukan untuk evolusi model AI dari model bahasa besar yang padat ke model ahli campuran skala besar dan arsitektur yang intensif inferensi.
(Sumber: InFoQ)
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 10
  • 2
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
LiquidityTeaMaster
· 51menit yang lalu
Virgo jaringan nama ini bagus, Virgo dengan gangguan obsesif tanpa hambatan
Lihat AsliBalas0
ZkSketcher
· 2jam yang lalu
Perluasan hampir linier hingga 1,7K ExaFlops, apakah Hukum Amdahl tidak berlaku lagi di Google?
Lihat AsliBalas0
MevBreakRoom
· 2jam yang lalu
TPU 8t bandwidth density ini agak gila, 47 Pb/s konsep apa
Lihat AsliBalas0
NonceNinja
· 2jam yang lalu
Dari JAX yang diperluas hingga jutaan chip, apakah Pathways akhirnya akan berguna?
Lihat AsliBalas0
MarginMoth
· 2jam yang lalu
Switch dengan basis tinggi terdengar mahal, tetapi menghemat modul optik dibandingkan dengan Clos tiga lapis.
Lihat AsliBalas0
0xPeachy
· 2jam yang lalu
Setelah membaca, saya hanya ingin bertanya: Kapan saya bisa mendapatkan kuota percobaan TPU v6?
Lihat AsliBalas0
SushiLatency
· 2jam yang lalu
Arm Axion CPU diintegrasikan, komputasi heterogen semakin seru dimainkan
Lihat AsliBalas0
Semi-MeltedIceCream
· 2jam yang lalu
VPU/MXU tumpang tindih keseimbangan, penjadwalan butir halus mencapai tingkat ini memang benar-benar kompetitif
Lihat AsliBalas0
QuietExitPlan
· 2jam yang lalu
13.4 juta chip satu struktur, bagaimana membagi domain kegagalannya adalah sebuah ilmu
Lihat AsliBalas0
GlassDomeUniverse
· 2jam yang lalu
Arsitektur LLM padat menjadi MoE + inferensi, ini adalah prediksi dari prediksi industri.
Lihat AsliBalas0
Lihat Lebih Banyak