Hal terbaik hari ini adalah konferensi GTC Nvidia, benar-benar sebuah sejarah singkat manusia versi AI.

robot
Pembuatan abstrak sedang berlangsung

Hari ini hal terpenting adalah konferensi GTC NVIDIA, benar-benar sebuah sejarah manusia versi AI.

Huang Renxun belum naik ke panggung, informasi bocoran yang sudah tersebar cukup untuk menulis satu buku.

Malam ini saya merangkum tiga poin utama, ayo teman-teman gemuk, ikuti saya.

1)Biaya daya komputasi AI langsung dipangkas menjadi sepertiga

Generasi sebelumnya Blackwell sudah sangat hebat, kan? Segera akan diumumkan chip generasi baru Vera Rubin yang akan diproduksi massal.

Apa hebatnya Vera Rubin? Sederhana saja: murah.

Menjalankan model AI yang sama, jumlah chip dipangkas menjadi seperempat, biaya inferensi turun sembilan kali lipat. Turun sembilan kali lipat, teman-teman. AWS, Microsoft, Google, tiga penyedia cloud besar langsung menjadi yang pertama mengadopsi.

2)Groq yang dibeli seharga 20 miliar dolar tahun lalu, hari ini menyerahkan hasil

Sebelumnya Huang Renxun mengatakan di rapat kinerja, Groq akan diintegrasikan sebagai arsitektur ekstensi ke dalam sistem NVIDIA, seperti saat mereka membeli Mellanox untuk melengkapi kemampuan jaringan.

LPU Groq dan GPU NVIDIA ditempatkan di pusat data yang sama, GPU memahami masalah, LPU bertanggung jawab untuk mengeluarkan jawaban dengan cepat.

Dua jenis chip ini bekerja sama, mengurangi latensi dalam skenario Agen secara langsung.

AI Agent bekerja untuk manusia, satu tugas bisa berulang kali mengubah model puluhan kali, setiap kali membakar daya inferensi, dan pengguna menunggu di sana, pengalaman menjadi lambat dan bisa crash.

Inferensi dilakukan dalam dua langkah, pertama memahami pertanyaanmu, lalu mengeluarkan jawaban satu per satu.

GPU ahli dalam langkah pertama, tetapi kecepatan dan kestabilan mengeluarkan kata-kata di langkah kedua, LPU Groq lebih unggul.

200 miliar, mahal tidak?

Bayangkan nanti setiap perusahaan menjalankan ratusan Agent, setiap Agent mengubah model ribuan kali setiap hari.

3)NemoClaw, versi NVIDIA dari OpenClaw, diluncurkan

Yaitu sebuah platform open-source, perusahaan bisa langsung menginstal untuk men-deploy AI worker yang menggantikan manusia dalam menjalankan proses, mengolah data, mengelola proyek. Dikatakan sudah berbicara dengan Salesforce dan Adobe.

Hal menariknya adalah, NemoClaw tidak mengharuskan menggunakan chip NVIDIA. Coba perhatikan logikanya. Menjual chip hanya mendapatkan keuntungan dari hardware saja, menetapkan aturan agar bisa mendapatkan keuntungan dari seluruh rantai. Huang Renxun sangat paham soal ini.

4)Huang Renxun mengatakan akan menampilkan “chip yang belum pernah dilihat dunia”

Kemungkinan besar adalah arsitektur generasi berikutnya, Feynman, yang akan muncul pertama kali, produksi massal tahun 2028, menggunakan proses 1.6nm TSMC yang paling canggih.

Selain itu, ada rumor kurang populer yang saya rasa cukup menarik.

NVIDIA akan merilis prosesor laptop, dua model, fokus pada gaming. Penjual kartu grafis akan bersaing untuk merebut pasar CPU.

Malam ini saya merasa Huang Renxun akan menjadi seorang tokoh besar di masa depan.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan