Hal terbaik hari ini adalah konferensi GTC Nvidia, benar-benar sebuah sejarah singkat manusia versi AI.

robot
Pembuatan abstrak sedang berlangsung

Hari ini hal terpenting adalah konferensi GTC Nvidia, benar-benar sebuah sejarah manusia versi AI.

Huang Renxun belum naik ke panggung, informasi bocoran yang sudah tersebar cukup untuk menulis satu buku.

Malam ini saya rangkum tiga poin utama, ayo teman-teman gemuk, ikuti saya.

1)Biaya daya komputasi AI langsung dipangkas menjadi sepertiga

Generasi sebelumnya Blackwell sudah sangat hebat, kan? Segera akan diumumkan chip generasi baru Vera Rubin yang akan diproduksi massal.

Apa hebatnya Vera Rubin? Sederhana saja: murah.

Menjalankan model AI yang sama, jumlah chip dipangkas menjadi seperempat, biaya inferensi turun sembilan kali lipat. Turun sembilan kali lipat, teman-teman. AWS, Microsoft, Google, tiga penyedia cloud utama langsung menjadi yang pertama mengadopsi.

2)Groq yang dibeli dengan 20 miliar dolar tahun lalu, hari ini menyerahkan pekerjaan

Sebelumnya Huang Renxun mengatakan di rapat kinerja, Groq akan diintegrasikan sebagai arsitektur ekstensi ke dalam sistem Nvidia, seperti saat mereka membeli Mellanox untuk melengkapi kemampuan jaringan.

LPU Groq dan GPU Nvidia ditempatkan di pusat data yang sama, GPU memahami masalah, LPU bertanggung jawab untuk mengeluarkan jawaban dengan cepat.

Dua jenis chip bekerja sama, mengurangi latensi dalam skenario Agen secara langsung.

AI Agen bekerja untuk orang, satu tugas bisa bolak-balik puluhan kali mengubah model, setiap kali membakar daya inferensi, dan pengguna menunggu di sana, jika lambat pengalaman langsung hancur.

Inferensi dilakukan dalam dua langkah, pertama memahami pertanyaanmu, lalu mengeluarkan jawaban satu per satu huruf.

GPU ahli dalam langkah pertama, tetapi kecepatan dan kestabilan mengeluarkan huruf di langkah kedua, LPU Groq lebih unggul.

200 miliar, mahal tidak?

Bayangkan nanti setiap perusahaan menjalankan ratusan Agen, setiap Agen mengubah model ribuan kali setiap hari.

3)NemoClaw, versi Nvidia dari OpenClaw, diluncurkan

Yaitu sebuah platform open-source, perusahaan bisa langsung menginstal untuk men-deploy karyawan AI menggantikan manusia menjalankan proses, mengelola data, mengatur proyek. Dikatakan sudah berbicara dengan Salesforce dan Adobe.

Hal menariknya adalah, NemoClaw tidak mengharuskan penggunaan chip Nvidia. Coba perhatikan logikanya. Menjual chip hanya mendapatkan keuntungan dari perangkat keras, menetapkan aturan agar bisa mendapatkan keuntungan dari seluruh rantai. Huang Renxun sangat paham soal ini.

4)Huang Renxun mengatakan akan menampilkan “chip yang belum pernah dilihat dunia”

Kemungkinan besar adalah arsitektur generasi berikutnya, Feynman, yang akan muncul pertama kali, produksi massal 2028, dengan proses 1.6nm TSMC yang paling canggih.

Selain itu, ada rumor kurang populer yang saya rasa cukup menarik.

Nvidia merilis prosesor laptop, dua model, fokus pada gaming. Penjual kartu grafis akan bersaing merebut pangsa CPU.

Malam ini saya merasa Huang Renxun akan menjadi seorang tokoh besar di masa depan.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan