Hal terbaik hari ini adalah konferensi GTC Nvidia, benar-benar sebuah sejarah singkat manusia versi AI.

robot
Pembuatan abstrak sedang berlangsung

Hari ini hal terpenting adalah konferensi GTC Nvidia, benar-benar sebuah sejarah manusia versi AI.

Huang Renxun belum naik ke panggung, informasi bocoran yang sudah tersebar cukup untuk menulis satu buku.

Malam ini saya merangkum tiga poin utama, ayo teman-teman gemuk, ikuti saya.

1)Biaya daya komputasi AI langsung dipotong setengah

Generasi sebelumnya Blackwell sudah sangat hebat, kan? Segera akan diumumkan chip generasi baru Vera Rubin yang akan diproduksi massal.

Apa hebatnya Vera Rubin? Sederhana saja: dua kata: murah.

Menggunakan model AI yang sama, jumlah chip dipangkas menjadi seperempat, biaya inferensi turun sembilan kali lipat. Turun sembilan kali lipat, teman-teman. AWS, Microsoft, Google, tiga penyedia cloud besar langsung menjadi yang pertama mengadopsi.

2)Groq yang dibeli dengan 20 miliar dolar tahun lalu, hari ini menyerahkan pekerjaan rumah

Sebelumnya Huang Renxun mengatakan di rapat kinerja bahwa Groq akan diintegrasikan sebagai arsitektur ekstensi ke dalam sistem Nvidia, seperti saat mereka membeli Mellanox untuk melengkapi kemampuan jaringan.

LPU Groq dan GPU Nvidia ditempatkan di pusat data yang sama, GPU memahami masalah, LPU bertanggung jawab untuk mengeluarkan jawaban dengan cepat.

Dua jenis chip ini bekerja sama, mengurangi latensi dalam skenario Agen secara langsung.

AI Agent melakukan pekerjaan untuk orang, satu tugas bisa bolak-balik puluhan kali mengubah model, setiap putaran menghabiskan daya inferensi, dan pengguna menunggu di sana, pengalaman menjadi lambat dan bisa crash.

Inferensi dilakukan dalam dua langkah, pertama memahami pertanyaanmu, lalu mengeluarkan jawaban satu per satu kata.

GPU ahli dalam langkah pertama, tetapi kecepatan dan kestabilan mengeluarkan kata di langkah kedua, LPU Groq lebih unggul.

200 miliar, mahal tidak?

Bayangkan nanti setiap perusahaan menjalankan ratusan Agent, setiap Agent mengubah model ribuan kali setiap hari.

3)NemoClaw, versi Nvidia dari OpenClaw, diluncurkan

Hanya sebuah platform sumber terbuka, perusahaan bisa langsung menginstal untuk men-deploy AI pekerja yang menggantikan manusia menjalankan proses, memproses data, mengelola proyek. Dikatakan sudah berbicara dengan Salesforce dan Adobe.

Hal menarik adalah, NemoClaw tidak mengharuskan penggunaan chip Nvidia. Coba perhatikan logikanya. Menjual chip hanya mendapatkan keuntungan dari perangkat keras, menetapkan aturan agar bisa mendapatkan keuntungan dari seluruh rantai. Huang Renxun sangat paham soal ini.

4)Huang Renxun mengatakan akan menampilkan “chip yang belum pernah dilihat dunia”

Kemungkinan besar adalah arsitektur generasi berikutnya, Feynman, yang akan muncul pertama kali, produksi massal 2028, dengan proses 1.6nm TSMC yang paling canggih.

Selain itu, ada rumor kurang populer yang saya rasa cukup menarik.

Nvidia merilis prosesor laptop, dua model, fokus pada gaming. Penjual kartu grafis akan bersaing merebut pangsa CPU.

Malam ini saya merasa Huang Renxun akan menjadi seorang tokoh besar di masa depan.

NVDAX0,81%
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan