Hari ini hal terpenting adalah konferensi GTC Nvidia, benar-benar sebuah sejarah singkat manusia versi AI.

robot
Pembuatan abstrak sedang berlangsung

Hari ini yang paling penting adalah konferensi GTC dari NVIDIA, seperti sebuah sejarah manusia versi AI.

Belum sempat Huang Renxun naik ke panggung, jumlah informasi yang bocor sudah cukup untuk menulis sebuah buku.

Wanwan merangkum tiga poin utama, ayo teman-teman gemuk, ikuti aku.

1)Biaya komputasi AI langsung dipotong menjadi sepersepuluh

Generasi Blackwell sebelumnya sudah sangat hebat, kan? Segera akan diumumkan produksi massal chip generasi baru, Vera Rubin.

Vera Rubin hebatnya di mana? Sederhananya dua kata: murah.

Jalankan model AI yang sama, jumlah chip dipotong menjadi seperempat, biaya inferensi turun sembilan puluh persen. Turun sembilan puluh persen, teman-teman. AWS, Microsoft, dan Google—tiga perusahaan cloud terbesar—langsung masuk gelombang pertama.

2)Groq yang tahun lalu dibeli dengan 200 miliar dolar, hari ini menyerahkan hasil

Sebelumnya Huang Renxun mengatakan dalam rapat kinerja bahwa Groq akan diintegrasikan ke dalam ekosistem NVIDIA sebagai arsitektur ekspansi, seperti saat membeli Mellanox untuk melengkapi kemampuan jaringan.

LPU Groq ditempatkan di pusat data yang sama dengan GPU NVIDIA, GPU memahami masalah, LPU bertugas mengeluarkan jawaban dengan cepat.

Dengan pembagian tugas antara dua jenis chip yang saling melengkapi, latensi di skenario Agent langsung ditekan.

AI Agent bekerja menggantikan manusia; satu tugas bisa bolak-balik puluhan kali menyesuaikan model, dan setiap putaran tetap membakar daya komputasi inferensi, sementara pengguna menunggu di sana—kalau sedikit lebih lambat, pengalaman jadi berantakan.

Inferensi dibagi menjadi dua langkah: pertama memahami pertanyaanmu, lalu mengeluarkan jawaban satu per satu huruf.

GPU unggul di langkah pertama, tetapi untuk kecepatan dan kestabilan saat “mengetik” jawaban di langkah kedua, LPU Groq lebih kuat.

Apakah 20 miliar dolar itu mahal?

Bayangkan nanti setiap perusahaan menjalankan ratusan Agent, dan setiap Agent setiap hari menyesuaikan model sampai beberapa ribu kali.

3)NemoClaw, versi OpenClaw dari NVIDIA, telah hadir

Ini adalah platform sumber terbuka, perusahaan cukup memasangnya untuk menjalankan AI pekerja yang menggantikan manusia dalam menjalankan proses, memproses data, dan mengelola proyek. Katanya sudah dalam tahap negosiasi dengan Salesforce dan Adobe.

Hal menariknya adalah, NemoClaw tidak mengharuskan penggunaan chip NVIDIA. Coba renungkan logikanya. Menjual chip hanya menghasilkan uang dari perangkat keras, tetapi dengan menetapkan aturan, bisa mendapatkan keuntungan dari seluruh rantai. Huang Renxun sangat memahami hal ini.

4)Huang Renxun bilang akan menampilkan “chip yang belum pernah dilihat dunia”

Kemungkinan besar yang pertama kali muncul adalah arsitektur generasi berikutnya, Feynman, yang akan diproduksi massal pada 2028 dengan proses 1.6nm paling canggih dari TSMC.

Selain itu, ada satu rumor yang cukup menarik menurutku.

NVIDIA mengeluarkan prosesor laptop, ada dua model, dengan fokus utama untuk gaming. Penjual kartu grafis akan datang merebut pasar CPU juga.

Wanwan, aku merasa Huang Renxun di masa depan akan menjadi tokoh besar yang luar biasa.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan