Hari ini hal terpenting adalah konferensi GTC Nvidia, benar-benar sebuah sejarah singkat manusia versi AI.

robot
Pembuatan abstrak sedang berlangsung

Hal paling penting hari ini adalah acara GTC dari NVIDIA, sungguh seperti sejarah manusia versi AI.

Belum juga Huang Renxun naik panggung, jumlah informasi yang bocor sebelumnya sudah cukup untuk ditulis menjadi sebuah buku.

Wanwan merangkum tiga hal menarik, ayo teman-teman gemuk, ikut aku.

1)Biaya komputasi AI turun langsung jadi sepersepuluh

Generasi Blackwell sebelumnya saja sudah sangat garang, kan? Sebentar lagi akan mengumumkan produksi massal chip generasi baru Vera Rubin.

Seberapa garangnya Vera Rubin? Kalau dipermudah, cuma dua kata: murah.

Jalankan model AI yang sama, jumlah chip dipangkas sampai seperempat, biaya komputasi inferensi turun sembilan puluh persen. Turun sembilan puluh persen, teman-teman. AWS, Microsoft, dan Google, tiga raksasa layanan cloud, langsung masuk batch pertama.

2)Groq yang tahun lalu dibeli 20 miliar dolar, hari ini serahkan tugas

Sebelumnya Huang Renxun pernah mengatakan di rapat kinerja bahwa Groq akan diintegrasikan sebagai arsitektur perluasan ke ekosistem NVIDIA, seperti saat dulu membeli Mellanox untuk melengkapi kemampuan jaringan.

LPU Groq dan GPU NVIDIA ada di pusat data yang sama; GPU memahami masalah, LPU bertugas mengeluarkan jawaban dengan cepat.

Pembagian kerja kedua jenis chip ini bekerja sama, latensi di skenario Agent langsung ditekan.

AI Agent menggantikan manusia bekerja; satu tugas bisa bolak-balik mengatur model puluhan putaran, dan di setiap putaran semuanya membakar komputasi inferensi—sementara pengguna menunggu di sana; kalau lebih lambat, pengalaman langsung runtuh.

Inferensi dibagi dua langkah: pertama memahami pertanyaanmu, lalu mengeluarkan jawabannya kata demi kata.

GPU jago di langkah pertama, tapi untuk kecepatan dan stabilitas saat “mengucapkan” huruf pada langkah kedua, LPU Groq lebih kuat.

20 miliar itu mahal?

Pikirkan saja nanti: setiap perusahaan menjalankan beberapa ratus Agent, dan setiap Agent setiap hari mengatur model ribuan kali.

3)OpenClaw versi NVIDIA diluncurkan, namanya NemoClaw

Ini adalah satu paket platform open source; perusahaan tinggal memasangnya untuk menerapkan “karyawan AI” yang menggantikan manusia menjalankan proses, memproses data, dan mengelola proyek. Konon sudah sedang membicarakan kerja sama dengan Salesforce dan Adobe.

Yang menarik ada pada kenyataan bahwa NemoClaw tidak mengharuskan kamu memakai chip NVIDIA. Coba kamu renungkan logika ini. Menjual chip hanya menghasilkan uang dari lapisan perangkat keras; dengan menetapkan aturan barulah bisa menghasilkan uang dari seluruh rantai. Huang Renxun menghitung ini dengan sangat matang.

4)Huang Renxun bilang akan menampilkan chip yang “belum pernah dilihat dunia”

Kemungkinan besar yang pertama kali muncul adalah arsitektur generasi berikutnya Feynman, diproduksi massal pada 2028, dengan proses 1,6nm paling canggih dari TSMC.

Selain itu, ada juga satu bahan “kelas dingin” yang menurutku menarik.

NVIDIA membuat prosesor laptop, ada dua model, andalannya untuk game. Yang jual kartu grafis mau merebut kembali urusan pekerjaan CPU juga.

Wanwan rasanya, Huang Renxun ke depannya akan jadi tokoh agung generasi ini.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan