GTC Nvidia: Perayaan Musim Semi Dunia AI, Penuh Harapan namun Pulang dengan Kecewa?

16 Maret 2026, pendiri sekaligus CEO Nvidia, Huang Renxun, menyampaikan pidato utama di konferensi GTC 2026, dengan topik utama mencakup perayaan 20 tahun platform CUDA, titik balik inferensi dan ledakan kebutuhan daya komputasi, arsitektur sistem Vera Rubin, integrasi Groq, revolusi agen OpenClaw, serta AI fisik dan robotika.

  1. Poin-poin utama GTC 2026

1) Prospek pendapatan pusat data: Pendapatan kumulatif pusat data dari 2025 hingga 2027 diperkirakan mencapai 1 triliun dolar AS (tahun lalu di GTC disebutkan 500 miliar dolar AS untuk 2025-2026), sesuai ekspektasi. Ekspektasi pasar utama sendiri telah meningkat ke atas 1 triliun dolar AS, dan yang lebih dinantikan adalah perusahaan dapat memberikan informasi yang jelas mengenai pesanan dan aspek lainnya.

2) Performa dan biaya: Dalam dua dimensi tokens/watt (throughput) dan kecepatan token (kecerdasan), Nvidia berada di posisi tertinggi secara global; biaya token Nvidia juga terendah di dunia.

3) Pusat data menjadi “pabrik token”: Setiap pabrik dibatasi oleh daya (misalnya 1GW), perlu mengelola throughput dan kecepatan produksi token.

Token akan dibagi menjadi tingkatan seperti komoditas besar: lapisan gratis (tinggi throughput, kecepatan rendah) -> lapisan $3/juta token -> lapisan $6/juta token -> lapisan $45/juta token -> lapisan $150/juta token (tingkat tertinggi dengan latensi rendah dan bandwidth tinggi).

Sebagai contoh, pusat data 1GW, setiap 25% daya dialokasikan ke satu tingkatan: Grace Blackwell dapat menghasilkan 5 kali lipat pendapatan dibanding Hopper, dan Vera Rubin dapat meningkatkannya lagi hingga 5 kali lipat.

4) Vera Rubin: Berdasarkan enam jenis chip sebelumnya, ditambahkan Groq 3 LPU.

① Vera Rubin: pendinginan cair 100% (pendinginan air panas 45°C), semua kabel dihilangkan, waktu instalasi dipersingkat dari dua hari menjadi dua jam;

② Switch Spectrum-X CPO (co-packaged optical): sudah diproduksi secara massal, dikembangkan bersama TSMC;

③ CPU: satu-satunya CPU pusat data yang menggunakan LPDDR5, dijual secara terpisah, akan menjadi bisnis bernilai miliaran dolar;

Vera CPU Tray digunakan untuk beban kerja Agentic, satu Vera Compute Tray mengintegrasikan 8 prosesor Vera, masing-masing 88 inti, mendukung 8 saluran memori LPDDR5x, dengan bandwidth memori per socket hingga 1,2TB/s. Pada CPU Tray juga terpasang 2 DPU BF4.

④ Vera Rubin: sudah berjalan di Microsoft Azure (rack pertama). Rantai pasok Nvidia mampu memproduksi ribuan sistem per minggu, dan kapasitas pabrik AI bernilai beberapa GW per bulan;

⑤ Rubin Ultra: Rubin adalah rak geser horizontal, sedangkan Rubin Ultra akan dipasang secara vertikal ke dalam rak baru Kyber, dengan 144 GPU dalam satu domain NVLink, dan di belakang papan tengah digunakan switch NVLink menggantikan kabel tembaga.

5) Groq 3 LPU (chip baru): Penggunaan bersamaan Groq dan HBM, sesuai ekspektasi.

Teknologi berasal dari tim Groq yang diakuisisi, Groq LP30 diproduksi oleh Samsung, diperkirakan akan dikirimkan pada kuartal ketiga.

Satu chip Groq 500MB SRAM vs satu chip Rubin 288GB, Groq sendiri tidak mampu menampung parameter model besar dan KV Cache secara mandiri.

Solusinya: diperkenalkan software Dynamo yang memecah langkah inferensi:

  1. Tahap prefill: juga disebut Prefill, yaitu tahap pemrosesan massal input Prompt dari pengguna, terutama berbasis kalkulasi, dilakukan di Vera Rubin;

  2. Tahap perhatian decoding: menghitung hubungan token yang dihasilkan saat ini dengan token-token historis (KV Cache, memori percakapan), merupakan pekerjaan yang melibatkan kalkulasi dan penyimpanan secara bersamaan, juga dilakukan di Vera Rubin, dengan sering membaca unit memori HBM di Rubin.

  3. Feedforward network (FNN) decoding: setelah konteks ditentukan di tahap Attention, jaringan feedforward bertugas menghasilkan distribusi probabilitas token berikutnya berdasarkan token sebelumnya, dan memilih token berikutnya, yaitu “pengucapan”.

Setiap lapisan dalam tahap ini harus membaca bobot model, satu kali baca hanya bisa memproses satu token. Parameter awalnya disimpan di HBM, unit kalkulasi menunggu data dipindahkan dari HBM, inilah yang menjadi titik kemacetan “tembok memori”.

Dengan memecah decoding menjadi dua tahap melalui software, model tetap menyimpan “memori konteks” di HBM saat bekerja, tetapi sebagian besar parameter model dipindahkan ke SRAM Groq, yang tertanam di chip, mampu membaca bobot ini dengan latensi sangat rendah, sehingga mengatasi masalah lambatnya pengucapan inferensi.

Antara Rubin dan Groq dihubungkan secara ketat melalui Ethernet, dengan mode koneksi RDMA khusus yang dapat mengurangi latensi interaksi antar chip sekitar setengahnya.

6) Feynman: GPU baru + LP40 (LPU) + CPU Rosa (dengan nama Rosalind) + BlueField-5 + CX10.

Scale-up kabel tembaga Kyber + scale-up CPO Kyber (pertama kali mendukung keduanya secara bersamaan). Ini berarti, bahkan di tahap Feynman, akan mendukung kombinasi kabel tembaga dan CPO secara bersamaan.

Meskipun Nvidia secara jangka panjang mendukung solusi CPO, pelanggan cenderung memaksimalkan penggunaan kabel tembaga terlebih dahulu sebelum beralih ke CPO (lebih mudah dalam deployment dan pemeliharaan).

7) Informasi lain:

① Pusat data luar angkasa: Mengatasi masalah kekurangan energi, Nvidia mengumumkan Vera Rubin Space-1, berencana menempatkan pusat data ke luar angkasa (perlu mengatasi masalah radiasi dan pendinginan, karena di luar angkasa tidak ada konduksi dan konveksi, hanya radiasi);

② OpenClaw: Setiap perusahaan SaaS akan menjadi GaaS (Agent-as-a-Service).

Sistem agen dapat mengakses informasi sensitif, menjalankan kode, dan berkomunikasi secara eksternal—ini membutuhkan keamanan tingkat perusahaan. Nvidia bekerja sama dengan pendiri OpenClaw, Peter Steinberger, meluncurkan NemoClaw (referensi desain keamanan perusahaan OpenClaw), yang mengintegrasikan teknologi OpenShell, termasuk penghalang jaringan (network guardrail) dan router privasi (privacy router), yang dapat terhubung ke mesin strategi berbagai SaaS;

③ AI fisik dan robotika: Dalam hal kendaraan otonom, produsen seperti BYD, Geely, Hyundai, Nissan bergabung dalam Robtaxi, bekerja sama dengan Uber. Di bidang robot, ada produsen seperti KUKA, ABB, dan banyak platform robot dan drone lainnya.

Secara keseluruhan, dalam konferensi ini, selain memperjelas bahwa kabel tembaga dan CPO akan digunakan secara bersamaan, hal utama adalah penambahan opsi LPU dari Groq pada server baru. Setelah Groq diakuisisi, pasar sudah memiliki ekspektasi yang cukup; bahkan panduan pendapatan 1 triliun dolar AS dalam tiga tahun pun sebenarnya sudah dilampaui oleh pasar.

Secara umum, dari iterasi produk Nvidia dalam beberapa tahun terakhir, fokus utama bukan lagi pada inovasi arsitektur chip, melainkan pada penyelesaian masalah kombinasi dan koneksi, dari Hopper ke Blackwell, Nvidia telah beralih dari penjualan chip ke penjualan sistem dan layanan.

Dari Blackwell ke Rubin, baik penambahan DPU (chip NAND) maupun LPU (SRAM) yang dibeli mendadak kali ini, utamanya menyelesaikan masalah AI memasuki era inferensi dan agen, serta tembok memori.

  1. Kondisi Nvidia saat ini: panduan konferensi datar, membutuhkan “kisah pertumbuhan baru”

Performa harga saham Nvidia dalam hampir enam bulan terakhir cenderung berfluktuasi di kisaran 170-200 dolar AS. Bahkan dengan para perusahaan besar di hilir meningkatkan belanja modal dan kinerja perusahaan terus melampaui ekspektasi, harga saham mereka tidak mampu menembus ke atas, karena pasar memiliki kekhawatiran berikut:

a) Keberlanjutan belanja modal perusahaan besar: Meta, Google, dan lainnya secara tegas meningkatkan belanja modal tahun 2026, dengan empat penyedia cloud utama diperkirakan mengeluarkan lebih dari 660 miliar dolar AS pada 2026, meningkat 60% dari tahun sebelumnya. Namun, perlu dicatat bahwa proporsi belanja modal perusahaan besar terhadap pendapatan sudah cukup tinggi.

Sebagai contoh, Meta memperkirakan belanja modal tahun 2026 mencapai 115-135 miliar dolar AS, dengan rasio belanja modal terhadap pendapatan tahunan lebih dari 50%, sehingga ruang peningkatan lebih terbatas. Meski semua perusahaan besar menambah proyeksi investasi 2026, kekhawatiran pasar terhadap keberlanjutan pertumbuhan belanja modal di masa mendatang tetap ada.

b) Pangsa pasar chip AI: Saat ini, Nvidia mempertahankan pangsa pasar di atas 75%, dengan harga tinggi dan struktur pasar yang hampir monopoli, mendorong para penyedia cloud di hilir mencari “alternatif”.

Selain Google, Broadcom AVGO telah mendapatkan pesanan besar dari perusahaan seperti Anthropic dan OpenAI, dan banyak pelanggan mulai mengembangkan solusi internal mereka sendiri. Meski Nvidia akan merilis produk Rubin baru, pasar secara umum memperkirakan pangsa pasar chip AI Nvidia akan perlahan menurun.

3) Daya saing produk: Saat ini, performa TPUv7 Google di bidang FP8 dan lainnya sudah mendekati B200 Nvidia (diproduksi massal kuartal keempat 2024), dan TPU Google kira-kira tertinggal satu tahun dari Nvidia.

Nvidia memperkenalkan format NVFP4 di seri Blackwell, yang dapat menggandakan performa inferensi di atas FP8. Namun, sebenarnya FP8 sudah memenuhi sebagian besar kebutuhan pasar saat ini, dan TPUv7 sudah menjadi “alternatif pengganti”.

Untuk menghadapi kompetisi industri, Nvidia sedang melakukan investasi strategis dan perluasan kapasitas komputasi, untuk mengunci rantai pasok dan hulu-hilirnya, seperti investasi strategis sebesar 30 miliar dolar AS untuk OpenAI dan 10 miliar dolar AS untuk Anthropic, serta menyediakan ratusan ribu GPU untuk laboratorium AI baru Meta, dengan beberapa perjanjian yang juga mengandung diskon untuk mengunci permintaan pelanggan.

Dengan kekhawatiran pasar tersebut, valuasi perusahaan juga relatif rendah. Menurut prediksi, jika pusat data mencapai pendapatan 1,15 triliun yuan (lebih tinggi dari panduan perusahaan 1 triliun), dan kapitalisasi pasar Nvidia saat ini sekitar 4,4 triliun dolar AS, maka laba bersih untuk FY 2028 (mendekati tahun 2027) diperkirakan sekitar 13 kali PE (dengan asumsi pertumbuhan pendapatan gabungan 64% selama dua tahun, margin laba kotor 72%, dan tarif pajak 18%).

Nvidia melaporkan laba kuartal terakhir yang melampaui ekspektasi, tetapi harga sahamnya tidak naik. Hal ini terutama karena setelah seluruh proyeksi pendapatan 2027 sudah dihitung, pasar khawatir bahwa setelah belanja modal hilir di atas 50%, ruang untuk meningkatkan belanja modal lebih jauh sangat terbatas.

Secara teori, Nvidia yang bergantung pada pasar cloud, meskipun pelanggan mempertahankan belanja modal tinggi, pendapatan dari pelanggan cloud akan stagnan nol, sehingga pasar tidak berani memberi valuasi tinggi setelah 2027. Ini menyebabkan PE saat ini sekitar 13 kali lipat dari laba 27 tahun, dan minat untuk membangun posisi juga rendah.

Melihat isi konferensi GTC kali ini, Huang memberi sinyal bahwa “pendapatan kumulatif pusat data mencapai lebih dari 1 triliun dolar AS hingga 2027” sebenarnya sudah diperkirakan pasar bahkan lebih tinggi dari angka tersebut.

Lebih banyak waktu diberikan untuk promosi produk Nvidia dan perencanaan jalur, serta pengaruh terhadap perusahaan rantai industri (CPO dan kabel tembaga akan tetap digunakan secara campuran, LPU dan HBM akan berbagi beban kerja berbeda), namun informasi tambahan tentang perusahaan sendiri relatif terbatas.

Ke depan, jika PE Nvidia kembali meningkat, menurut saya, selain aplikasi AI yang dapat diimplementasikan secara lebih besar dan cepat, diperlukan juga “kurva pertumbuhan” baru untuk mendorong, seperti “Physic AI”, “kekuatan komputasi luar angkasa”, dan lain-lain.

Sumber artikel: Hai Tun Research

Peringatan risiko dan ketentuan penafian

Pasar berisiko, investasi harus dilakukan dengan hati-hati. Artikel ini tidak merupakan saran investasi pribadi, dan tidak mempertimbangkan tujuan investasi, kondisi keuangan, atau kebutuhan khusus pengguna. Pengguna harus menilai apakah saran, pandangan, atau kesimpulan dalam artikel ini sesuai dengan kondisi mereka. Investasi dilakukan atas risiko sendiri.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan