AMD Menyajikan Hasil Inference MLPerf 6.0 yang Terobosan

robot
Pembuatan abstrak sedang berlangsung

Pengajuan terbaru MLPerf Inference 6.0 dari AMD menunjukkan kemajuan yang signifikan dengan GPU Instinct MI355X-nya, melampaui 1 juta token per detik pada skala multinode dan berkembang ke beban kerja baru seperti generasi teks-ke-video. Hasil ini menunjukkan kinerja single-node yang kompetitif dibandingkan GPU NVIDIA B200 dan B300, penskalaan yang efisien, serta reproduktibilitas ekosistem yang luas, yang sebagian besar disebabkan oleh tumpukan perangkat lunak AMD ROCm. Pencapaian ini menempatkan AMD sebagai penantang yang kuat di pasar inferensi generative AI, dengan peta jalan yang jelas untuk seri GPU Instinct di masa depan dan solusi skala rak.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan