Hari ini hal terpenting adalah konferensi GTC Nvidia, benar-benar sebuah sejarah singkat manusia versi AI.

robot
Pembuatan abstrak sedang berlangsung

Hal paling penting hari ini adalah acara GTC NVIDIA, sungguh seperti sebuah sejarah manusia edisi AI.

Sebelum Huang Renxun naik panggung, jumlah informasi yang bocor lebih dulu sudah cukup untuk menulis sebuah buku.

Wanwan sudah merapikan tiga sorotan, ayo kawan-kawan gemuk, ikut aku.

1)Biaya komputasi AI langsung jadi sepersepuluh

Blackwell generasi sebelumnya sudah hebat, kan? Sebentar lagi akan mengumumkan produksi massal chip generasi baru Vera Rubin.

Vera Rubin hebat di mana? Intinya dua kata: murah.

Jalankan model AI yang sama, jumlah chip dipangkas jadi seperempat, biaya komputasi inferensi turun sembilan puluh persen. Turun sembilan puluh persen, kawan-kawan. AWS, Microsoft, dan Google—tiga raksasa layanan cloud—langsung ikut armada batch pertama.

2)Groq yang dibeli tahun lalu senilai 20 miliar dolar, hari ini menyerahkan tugas

Sebelumnya Huang Renxun bilang dalam rapat kinerja bahwa Groq akan terhubung ke ekosistem NVIDIA sebagai arsitektur perluasan, seperti saat dulu mereka membeli Mellanox untuk melengkapi kemampuan jaringan.

LPU Groq dan GPU NVIDIA berada di pusat data yang sama; GPU memahami masalah, LPU bertugas memuntahkan jawaban dengan cepat.

Dengan pembagian kerja dua jenis chip ini, latensi skenario Agent langsung terpangkas.

Agent AI mengerjakan tugas untuk manusia; satu tugas bisa bolak-balik mengatur model puluhan putaran, dan di setiap putaran semuanya membakar komputasi inferensi, sementara pengguna menunggu di sana—kalau lambat, pengalaman langsung ambyar.

Inferensi dibagi dua langkah: pertama memahami pertanyaanmu, lalu menuliskan jawaban kata demi kata.

GPU jago di langkah pertama, tapi untuk kecepatan dan stabilitas saat “mengeluarkan huruf”, LPU Groq lebih kuat.

Apakah 20 miliar dolar itu mahal?

Coba pikirkan nanti: setiap perusahaan akan menjalankan ratusan Agent, dan setiap Agent tiap hari mengatur model beberapa ribu kali.

3)OpenClaw versi NVIDIA hadir, namanya NemoClaw

Ini adalah paket platform open source. Jika dipasang perusahaan, bisa dideploy “karyawan AI” untuk menggantikan manusia menjalankan alur kerja, memproses data, dan mengelola proyek. Katanya sudah sedang berdiskusi dengan Salesforce dan Adobe.

Yang menarik justru karena NemoClaw tidak mengharuskanmu memakai chip NVIDIA. Coba kamu cerna logikanya. Menjual chip cuma menghasilkan uang di lapisan perangkat keras; dengan menetapkan aturan, baru bisa menghasilkan uang di seluruh rantai. Huang Renxun jelas menghitung dengan sangat matang.

4)Huang Renxun bilang mereka akan menampilkan chip “yang belum pernah dilihat dunia”

Kemungkinan besar yang pertama muncul adalah arsitektur generasi berikutnya, Feynman, produksi pada 2028, dengan proses 1.6nm paling canggih dari TSMC.

Selain itu ada satu bahan rahasia yang menurutku cukup menarik.

NVIDIA mengeluarkan prosesor untuk laptop, ada dua model, fokusnya untuk bermain game. Penjual kartu grafis mau datang merebut meja makan untuk CPU, ya.

Aku rasa, ke depannya Huang Renxun bakal menjadi sosok besar satu generasi.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan