Guang Fa Securities: NVIDIA (NVDA.US) Platform Baru Memperkuat Daya Saing Aplikasi Agent, Inference AI Mendorong Siklus Penyimpanan Terus Meningkat

robot
Pembuatan abstrak sedang berlangsung

Fidelity Securities merilis laporan riset yang menyatakan bahwa NVIDIA (NVDA.US) menampilkan Vera RubinPOD di GTC, dengan fokus meningkatkan daya saing aplikasi Agent dalam lini produk komputasi klaster dan inferensi. Saat AI memasuki fase penting, inovasi model dan pembangunan CAPEX menjadi dasar, serta pengembangan kolaboratif rantai industri AI; inferensi AI mendorong siklus penyimpanan terus meningkat, dengan ekspansi dan peningkatan kapasitas secara bersamaan. Disarankan untuk memperhatikan saham utama yang mendapatkan manfaat dari rantai industri.

Poin utama dari Fidelity Securities adalah sebagai berikut:

NVIDIA merilis platform Vera Rubin POD

Menurut situs resmi NVIDIA, pada 16 Maret 2026, NVIDIA menampilkan Vera RubinPOD di GTC, termasuk 5 sistem rak baru yang dirancang khusus untuk beban kerja AI Agentic. Karena beban kerja Agentic menuntut throughput tinggi, latensi sangat rendah, inferensi yang cepat, sandbox CPU yang padat, dan memori konteks besar, NVIDIA kali ini fokus memperkuat daya saing aplikasi Agent dalam lini produk komputasi klaster dan inferensi. Vera Rubin POD terbagi menjadi dua jenis rak: (1) Rak MGXNVL: yaitu Vera Rubin NVL72, yang saling terhubung melalui NVLink di dalam rak, bertanggung jawab atas tugas komputasi GPU utama; (2) Rak MGXETL: termasuk rak Groq3 LPX, rak Vera CPU, rak penyimpanan BlueField-4 STX, dan rak jaringan Spectrum-6 SPX, yang semuanya saling terhubung langsung melalui Ethernet SpectrumX atau chip Groq3 LPU untuk kolaborasi. Berdasarkan diagram resmi, satu Vera Rubin 1152 SuperPOD terdiri dari 16 rak Vera Rubin NVL72, 2 rak Vera CPU, 10 rak Groq 3 LPX, 2 rak BlueField-4 STX, dan 10 rak Spectrum-6 SPX, menunjukkan arsitektur sistem heterogen yang dibangun untuk mendukung AI Agentic.

Rak Groq3 LPX digunakan untuk mempercepat decoding.

Rak Groq3 LPX mengintegrasikan 256 prosesor LPU, dilengkapi SRAM on-chip 128 GB dan bandwidth 640 TB/s. Dalam kombinasi arsitektur Vera Rubin NVL72 dan LPX, GPU terutama bertanggung jawab atas tahap Prefill dan Attention dalam decoding, sementara LPU mempercepat perhitungan FFN selama decoding, mempercepat proses decoding token output per lapisan, dan berkolaborasi dengan rak Vera Rubin melalui interkoneksi Spectrum-X yang dikustomisasi. Menurut pengungkapan resmi NVIDIA, dalam kondisi 400 TPS per pengguna, kombinasi Vera Rubin NVL72 dan LPX dapat mencapai peningkatan TPS hingga 35 kali lipat per megawatt dibandingkan NVIDIA GB200 NVL72, meningkatkan output sistem secara keseluruhan dan lebih cocok untuk aplikasi Agent yang membutuhkan latensi rendah dan interaksi kuat.

Rak Vera CPU bertanggung jawab mendukung lingkungan sandbox RL/Agent

Rak Vera CPU mengintegrasikan 256 Vera CPU, menggunakan desain pendingin cair berkapasitas tinggi, dan mampu mendukung lebih dari 22.500 lingkungan sandbox reinforcement learning (RL) atau agen untuk pengujian, eksekusi, dan verifikasi output dari Vera Rubin NVL72 dan LPX.

Peringatan risiko

Perkembangan industri AI dan permintaan yang tidak sesuai harapan; volume pengiriman server AI yang tidak sesuai harapan; kemajuan teknologi dan produk produsen domestik yang tidak sesuai harapan.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan