Google merilis panduan pelatihan pengembang TPU Ironwood generasi ketujuh, penjelasan lengkap tentang optimisasi kinerja tingkat sistem

MeNews · 2026-04-10T12:45:10+00:00

Google merilis panduan pelatihan pengembang untuk TPU Ironwood generasi ketujuh, bertujuan membantu pengembang melatih dan mengimplementasikan model AI secara efisien. Panduan ini memperkenalkan beberapa strategi optimisasi utama, seperti pelatihan FP8, perpustakaan inti JAX yang dioptimalkan untuk TPU, komunikasi pengalihan inti jarang, penyesuaian alokasi memori, dan lain-lain, untuk meningkatkan kinerja sistem TPU Ironwood.

MeNews

2026-04-10 12:45:10

Pembuatan abstrak sedang berlangsung

Berita ME News, 2 April (UTC+8), Google secara resmi merilis panduan pelatihan pengembang untuk TPU Ironwood generasi ketujuh.
Panduan ini bertujuan membantu pengembang memanfaatkan secara maksimal kinerja sistem TPU Ironwood, untuk melatih dan menyebarkan model AI terdepan secara efisien.
TPU Ironwood dirancang sebagai infrastruktur AI kustom yang memenuhi kebutuhan daya komputasi untuk model dengan triliunan parameter, yang membangun sistem lengkap melalui teknologi seperti interkoneksi antar chip (ICI), switch optik (OCS), jaringan pusat data (DCN), dan memori bandwidth tinggi terintegrasi (HBM).
Artikel ini secara rinci memperkenalkan berbagai strategi optimisasi kunci untuk perangkat keras ini, termasuk: memanfaatkan unit perkalian matriks (MXU) yang mendukung pelatihan FP8 secara native untuk meningkatkan throughput; menggunakan perpustakaan inti JAX yang dioptimalkan khusus untuk TPU, Tokamax, melalui “perhatian cipratan” dan “Megablox grouped matrix multiplication” untuk menangani konteks panjang dan model pakar campuran dalam tensor yang tidak beraturan; memanfaatkan Core Sparse generasi keempat (SparseCore) untuk mengalihkan operasi komunikasi kolektif guna menyembunyikan latensi; melakukan tuning halus pada alokasi SRAM cepat TPU (VMEM) untuk mengurangi stagnasi memori; serta memilih strategi partisi terbaik (seperti FSDP, TP, EP) berdasarkan skala model, arsitektur, dan panjang urutan. (Sumber: InFoQ)

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

1 Suka