Google merilis panduan pelatihan pengembang TPU Ironwood generasi ketujuh, penjelasan lengkap tentang optimisasi kinerja tingkat sistem

MeNews · 2026-04-10T03:35:02+00:00

ME News Berita, 2 April (UTC+8), Google resmi merilis panduan pelatihan pengembang untuk TPU Ironwood generasi ketujuh. Panduan ini bertujuan membantu pengembang memanfaatkan kinerja sistem tingkat tinggi dari TPU Ironwood secara maksimal untuk melatih dan mengimplementasikan model AI terdepan secara efisien. Ironwood

MeNews

2026-04-10 03:35:02

Berita ME News, 2 April (UTC+8), Google baru-baru ini merilis panduan pengembangan untuk TPU Ironwood generasi ketujuh. Panduan ini bertujuan membantu pengembang memanfaatkan secara maksimal kinerja sistem TPU Ironwood, agar dapat melatih dan men-deploy model AI terdepan secara efisien. TPU Ironwood dirancang sebagai infrastruktur AI kustom yang memenuhi kebutuhan komputasi model dengan triliunan parameter, yang membangun sistem lengkap dengan teknologi seperti interkoneksi antar chip (ICI), switch optik (OCS), jaringan pusat data (DCN), dan memori bandwidth tinggi terintegrasi (HBM), mendukung hingga 9.216 chip. Artikel ini secara rinci memperkenalkan berbagai strategi optimisasi penting untuk perangkat keras ini, termasuk: memanfaatkan unit perkalian matriks (MXU) yang mendukung pelatihan FP8 secara native untuk meningkatkan throughput; menggunakan perpustakaan kernel JAX yang dioptimalkan khusus untuk TPU, Tokamax, yang memproses tensor tidak beraturan dalam model konteks panjang dan model ahli campuran melalui “perhatian cipratan” dan “perkalian matriks grup Megablox”; memanfaatkan core jarang (SparseCore) generasi keempat untuk mengalihkan operasi komunikasi kolektif guna menyembunyikan latensi; mengoptimalkan alokasi SRAM cepat TPU (VMEM) secara rinci untuk mengurangi stagnasi memori; serta memilih strategi partisi terbaik (seperti FSDP, TP, EP) berdasarkan skala model, arsitektur, dan panjang urutan. (Sumber: InFoQ)

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

2 Suka