Hari ini hal terpenting adalah konferensi GTC Nvidia, benar-benar sebuah sejarah singkat manusia versi AI.

robot
Pembuatan abstrak sedang berlangsung

Hal yang paling penting hari ini adalah konferensi GTC dari Nvidia—benar-benar sejarah manusia versi AI.

Belum sempat Huang Renxun naik ke panggung, jumlah informasi yang bocor lebih dulu sudah cukup untuk ditulis menjadi sebuah buku.

Riri menyusun tiga sorotan utama. Ayo, teman-teman gemuk, ikut aku.

1)Biaya komputasi AI langsung jadi diskon sepersepuluh

Generasi Blackwell sebelumnya sudah sangat gahar, kan? Tidak lama lagi akan diumumkan produksi massal chip generasi baru Vera Rubin.

Vera Rubin hebatnya di mana? Intinya cuma dua kata: murah.

Jalankan model AI yang sama, jumlah chip dipangkas menjadi seperempat, biaya komputasi inferensi turun sembilan puluh persen. Turun sembilan puluh persen, teman-teman. AWS, Microsoft, dan Google sebagai tiga penyedia layanan cloud terbesar langsung menjadi batch pertama yang naik.

2)Groq yang tahun lalu dibeli seharga 20 miliar dolar, hari ini menyerahkan tugasnya

Sebelumnya, Huang Renxun pernah mengatakan dalam rapat kinerja bahwa Groq akan dihubungkan sebagai arsitektur ekstensi ke ekosistem Nvidia—seperti dulu saat membeli Mellanox untuk melengkapi kemampuan jaringan.

LPU Groq dan GPU Nvidia berada di pusat data yang sama. GPU memahami masalahnya, LPU bertugas mengeluarkan jawaban dengan cepat.

Dengan pembagian kerja kedua jenis chip ini, latensi untuk skenario Agent langsung ditekan.

Agent AI mengerjakan pekerjaan untuk manusia. Satu tugas bisa bolak-balik menyetel model puluhan putaran. Setiap putaran tetap membakar komputasi inferensi, sementara pengguna menunggu di sana—kalau lebih lambat, pengalaman langsung berantakan.

Inferensi dibagi dua langkah: pertama memahami pertanyaanmu, lalu menuliskan jawabannya kata demi kata.

GPU unggul di langkah pertama, tetapi untuk kecepatan dan stabilitas saat “mencetak kata-kata” di langkah kedua, LPU Groq lebih kuat.

20 miliar dolar itu mahal?

Coba pikirkan saja nanti: setiap perusahaan akan menjalankan ratusan Agent, dan setiap Agent setiap hari menyetel model beberapa ribu kali.

3)Peluncuran OpenClaw versi Nvidia, namanya NemoClaw

Ini adalah satu set platform open source. Jika perusahaan memasangnya, mereka bisa menerapkan “karyawan AI” untuk menggantikan manusia menjalankan proses, memproses data, dan mengelola proyek. Konon katanya sudah sedang membahas kerja sama dengan Salesforce dan Adobe.

Hal yang menarik ada pada kenyataan bahwa NemoClaw tidak mengharuskanmu menggunakan chip dari Nvidia. Coba renungkan logikanya. Menjual chip hanya menghasilkan uang dari lapisan perangkat keras; hanya dengan menetapkan aturan, baru bisa menghasilkan uang dari seluruh rantai. Huang Renxun menghitungnya dengan sangat jernih.

4)Huang Renxun mengatakan dia akan menampilkan “chip yang belum pernah dilihat dunia”

Kemungkinan besar itu adalah arsitektur generasi setelahnya, Feynman—kemungkinan besar untuk pertama kalinya muncul—produksi massal pada 2028, dengan proses 1.6nm paling maju dari TSMC.

Selain itu ada satu bahan yang agak kurang populer menurutku, dan itu menurutku cukup menarik.

Nvidia mengeluarkan prosesor untuk laptop, ada dua model, yang utamanya untuk game. Jadi penjual kartu grafis datang untuk merebut “pekerjaan makan” CPU, ya.

Riri merasa, di masa depan Huang Renxun akan menjadi tokoh besar satu generasi.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan