## NVIDIA Rubin platform resmi diumumkan: biaya inferensi turun 10 kali lipat, GPU berkurang 4 kali lipat, pengiriman akhir tahun 2026



NVIDIA secara resmi mengumumkan produk utama generasi berikutnya dari chip AI, platform Rubin, di CES 2025, yang merupakan kelanjutan dari tradisi perusahaan dalam melakukan iterasi dan pembaruan tahunan. Berdasarkan pengumuman langsung dari CEO Jensen Huang, enam chip inti Rubin telah kembali dari pabrik kontraktor dan telah menyelesaikan pengujian penting, memastikan dapat didistribusikan sesuai jadwal. Ini berarti NVIDIA tetap memimpin secara teknologi di bidang akselerator AI, sekaligus menanggapi kekhawatiran Wall Street tentang tekanan kompetitif dan keberlanjutan investasi AI mereka.

### Kinerja Melonjak, Biaya Signifikan Menurun

Dalam hal harga Rubin, meskipun NVIDIA belum mengumumkan harga spesifik, efisiensi biaya mereka meningkat secara signifikan. Dibandingkan dengan platform Blackwell sebelumnya, performa pelatihan Rubin meningkat 3,5 kali lipat, dan performa inferensi meningkat 5 kali lipat. Yang lebih mencolok adalah Rubin mampu menurunkan biaya pembuatan token selama proses inferensi sebanyak 10 kali lipat—yang berarti pengurangan besar dalam biaya operasional bagi perusahaan yang bergantung pada inferensi model besar.

Selain itu, Rubin mengurangi jumlah GPU yang dibutuhkan untuk melatih model ahli campuran(MoE) sebanyak 4 kali lipat. Ini berarti perusahaan dapat mencapai target performa yang sama dengan investasi perangkat keras yang lebih sedikit, secara langsung meningkatkan ROI dari pengadaan.

### Enam Pilar Inovasi Teknologi

Platform Rubin mengintegrasikan lima teknologi terobosan. Di antaranya, CPU Vera yang baru menggunakan 88 inti Olympus yang dikustomisasi, berbasis arsitektur Armv9.2, dengan performa per inti dua kali lipat dari solusi kompetitor. CPU ini dirancang khusus untuk mengoptimalkan inferensi agen AI dan merupakan prosesor paling efisien dalam pabrik AI skala besar saat ini.

Di sisi GPU, dilengkapi dengan mesin Transformer generasi ketiga, menawarkan kapasitas komputasi 50 petaflops NVFP4. Bandwidth satu GPU mencapai 3,6TB/s, sementara seluruh kabinet Vera Rubin NVL72 mencapai 260TB/s—level bandwidth ini menyediakan kapasitas aliran data yang cukup untuk pelatihan dan inferensi model skala besar.

Platform ini juga mengintegrasikan mesin komputasi rahasia generasi ketiga dan mesin RAS( generasi kedua untuk keandalan, ketersediaan, dan kemudahan pemeliharaan), mencakup CPU, GPU, dan NVLink secara lengkap, menyediakan pemantauan kesehatan real-time, mekanisme toleransi kesalahan, dan fungsi pemeliharaan aktif. Seluruh kabinet dirancang modular, mempercepat proses perakitan dan pemeliharaan 18 kali lebih cepat dibanding Blackwell.

### Pilihan Baru untuk Penyedia Cloud dan Laboratorium AI

NVIDIA mengumumkan bahwa beberapa perusahaan, termasuk penyedia infrastruktur cloud utama di industri, akan melakukan penggelaran instance Rubin pertama mereka pada akhir tahun 2026. Penyedia layanan cloud dan integrator ini akan menawarkan layanan sewa daya komputasi Rubin kepada pelanggan perusahaan.

Dalam komunitas pengembangan model AI, laboratorium terkenal seperti OpenAI, Anthropic, Meta, Mistral AI, dan xAI telah menyatakan akan menggunakan platform Rubin untuk melatih model generasi berikutnya yang lebih besar dan lebih kuat. CEO OpenAI Sam Altman menyatakan bahwa peningkatan kapasitas komputasi secara langsung mendorong evolusi agen cerdas, dan keunggulan performa platform Rubin akan terus mendorong proses ini. CEO Anthropic Dario Amodei menambahkan bahwa kemampuan peningkatan Rubin membawa perbaikan signifikan dalam kualitas inferensi dan keandalan model. CEO Meta Mark Zuckerberg menegaskan bahwa peningkatan efisiensi platform Rubin sangat penting untuk menyebarkan model AI tercanggih ke ratusan juta pengguna di seluruh dunia.

### Penataan Rantai Industri Secara Menyeluruh

Produsen perangkat keras server seperti Cisco, Dell, HPE, Lenovo, dan Supermicro telah merencanakan lini produk server terkait Rubin. Ini menunjukkan bahwa Rubin bukan sekadar inovasi GPU, tetapi juga mendorong peningkatan ekosistem infrastruktur AI secara keseluruhan.

NVIDIA memilih untuk mengungkapkan detail Rubin lebih awal dari biasanya tahun ini, sebagai strategi untuk mempertahankan ketergantungan industri dan daya tarik pasar. Biasanya perusahaan ini akan melakukan pengenalan produk mendalam di GTC California pada musim semi, tetapi pengungkapan awal di CES ini mencerminkan kondisi pasar yang semakin kompetitif dalam AI.

### Pandangan Jangka Panjang

Meskipun para investor masih meragukan pertumbuhan berkelanjutan NVIDIA dan keberlanjutan pengeluaran AI, NVIDIA tetap mempertahankan proyeksi pertumbuhan jangka panjangnya dan memperkirakan bahwa pasar AI global akan mencapai triliunan dolar. Peluncuran platform Rubin menandai bahwa NVIDIA terus memimpin dalam iterasi chip AI, sekaligus menegaskan bahwa daya saing Rubin dalam hal efisiensi biaya akan kembali mendefinisikan keputusan investasi perusahaan terhadap infrastruktur AI.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan

Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)