OpenAI mengembangkan protokol jaringan superkomputer MRC sumber terbuka: 100.000 GPU hanya membutuhkan dua lapis switch, pemulihan gangguan dari detik menjadi mikrodetik

Berita dari CoinWorld, protokol jaringan MRC (Multipath Reliable Connection) yang dikembangkan oleh OpenAI bekerja sama dengan AMD, Broadcom, Intel, Microsoft, dan Nvidia telah dirilis sebagai open source, mendukung 100.000 GPU hanya dengan dua lapis switch, sehingga waktu pemulihan gangguan dari hitungan detik menjadi mikrodetik. Protokol ini telah terintegrasi dalam kartu jaringan terbaru dengan kecepatan 800GB/s dan dirilis melalui OCP (Open Compute Project), kini telah diterapkan di semua superkomputer Nvidia GB200 skala besar milik OpenAI, termasuk klaster Abilene di Texas yang dibangun bersama Oracle dan superkomputer Fairwater milik Microsoft. Perubahan inti dari MRC adalah membagi pengiriman tunggal menjadi ratusan jalur yang dikirim secara bersamaan, menghindari masalah GPU yang menganggur akibat latensi transmisi dalam jaringan superkomputer tradisional.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan