Hari ini hal terpenting adalah konferensi GTC Nvidia, benar-benar sebuah sejarah singkat manusia versi AI.

robot
Pembuatan abstrak sedang berlangsung

Hari yang paling penting hari ini adalah acara GTC dari NVIDIA, benar-benar sebuah “sejarah manusia versi AI”.

Belum sempat Huang Renxun naik panggung, jumlah informasi yang bocor lebih dulu sudah cukup untuk menulis sebuah buku.

Wanwan merangkum tiga sorotan utama, ayo kawan-kawan gemuk, ikut aku.

1)Biaya komputasi AI langsung dipotong sampai sepersepuluhnya

Generasi Blackwell sebelumnya sudah hebat, kan?
Sebentar lagi akan diumumkan produksi massal chip generasi berikutnya, Vera Rubin.

Vera Rubin hebat di mana? Intinya cuma dua kata: murah.

Menjalankan model AI yang sama,
jumlah chip dipangkas menjadi seperempatnya, biaya komputasi inferensi turun sembilan puluh persen.
Turun sembilan puluh persen, kawan-kawan.
AWS, Microsoft, dan Google, tiga raksasa penyedia cloud, langsung masuk batch pertama.

2)Groq yang tahun lalu dibeli seharga 20 miliar dolar, hari ini menyerahkan tugas

Sebelumnya, Huang Renxun pernah mengatakan dalam rapat kinerja bahwa Groq akan diintegrasikan sebagai arsitektur ekspansi ke ekosistem NVIDIA, seperti saat dulu membeli Mellanox untuk melengkapi kemampuan jaringan.

LPU Groq berada di pusat data yang sama dengan GPU NVIDIA; GPU memahami masalah, LPU bertanggung jawab untuk mengeluarkan jawaban dengan cepat.

Dengan pembagian kerja dua jenis chip ini, latensi untuk skenario Agent langsung ditekan.

Agent AI bekerja menggantikan manusia; satu tugas bisa bolak-balik menyetel model puluhan putaran, dan setiap putaran menghabiskan komputasi inferensi—sementara pengguna menunggu di sana; kalau lebih lambat, pengalaman jadi berantakan.

Inferensi dibagi dua langkah: pertama memahami masalahmu, lalu mengeluarkan jawaban kata demi kata.

GPU jago di langkah pertama, tapi untuk kecepatan dan stabilitas saat “mengucapkan kata-kata” di langkah kedua, LPU Groq lebih kuat.

Apakah 20 miliar dolar itu mahal?

Coba pikirkan: nanti tiap perusahaan menjalankan ratusan Agent, dan setiap Agent menyetel model ribuan kali setiap hari.

3)OpenClaw versi NVIDIA diluncurkan, namanya NemoClaw

Ini adalah satu paket platform open source; perusahaan tinggal memasangnya untuk men-deploy “karyawan AI” yang menggantikan manusia menjalankan proses, memproses data, dan mengelola proyek.
Katanya sudah sedang bernegosiasi dengan Salesforce dan Adobe.

Yang menarik ada pada kenyataan bahwa NemoClaw tidak mengharuskanmu menggunakan chip buatan NVIDIA.
Coba renungkan logika ini. Menjual chip hanya menghasilkan uang dari lapisan perangkat keras; membuat aturanlah yang bisa menghasilkan uang dari seluruh rantai. Perhitungan Huang Renxun ini jelas dihitung sampai matang.

4)Huang Renxun bilang akan mendemonstrasikan “chip yang belum pernah dilihat dunia”

Kemungkinan besar itu adalah arsitektur generasi setelahnya, Feynman, yang pertama kali muncul ke publik, produksi masal pada 2028, dengan proses 1,6nm paling canggih dari TSMC.

Selain itu, ada satu materi yang relatif tidak populer tapi menurutku cukup menarik.

NVIDIA merilis prosesor laptop, ada dua model, dengan fokus pada game.
Penjual kartu grafis mau merebut porsi “makanan” CPU juga ya.

Wanwan, aku merasa Huang Renxun di masa depan bakal jadi tokoh besar satu generasi.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan