Kesempatan bisnis di balik "komputer agen cerdas" yang diumumkan oleh Jensen Huang: data tidak keluar dari mesin, Token sepenuhnya gratis

Awal bulan ini, pendiri Nvidia Jensen Huang meluncurkan chip super PC Windows pertama di dunia yang dirancang khusus untuk agen AI pribadi (AI Agent) — RTX Spark. Peluncuran ini dianggap sebagai perubahan paling revolusioner dalam industri PC sejak popularitas antarmuka grafis Windows pada tahun 1990-an, bahkan Huang menyebutnya sebagai "desain ulang dan rekonstruksi total pertama komputer pribadi selama 40 tahun."

Mungkin saat ini terlalu dini untuk menyatakan PC telah tergantikan, tetapi yang bisa diprediksi adalah definisi PC sedang melonggar. Seorang profesional industri senior mengatakan kepada wartawan bahwa produsen perangkat keras saat ini sedang berusaha keras menangkap peluang AI, dengan desain baru yang terus muncul dan ekosistem di sisi perangkat yang menunjukkan kehidupan yang berkembang pesat.

Mengubah Arsitektur Komputer Selama 40 Tahun

RTX Spark bukanlah usaha "sendirian" Nvidia, melainkan hasil dari kolaborasi ekosistem teknologi global terkuat, chip ini dirancang bersama oleh Nvidia dan MediaTek, diproduksi menggunakan proses 3 nanometer TSMC, dan Microsoft terlibat secara mendalam dalam pengoptimalan tingkat sistem.

Chip ini bukan CPU atau GPU tradisional, melainkan sebuah System-on-Chip (SoC) yang sangat terintegrasi, arsitektur intinya mengikuti konsep "heterogen fusion", menggabungkan beberapa komponen utama yang biasanya tersebar di motherboard PC ke dalam satu chip tunggal. Inovasi teknologi paling revolusioner adalah arsitektur memori yang bersatu — PC tradisional menggunakan desain memori terpisah antara CPU (central processing unit) dan GPU (graphics processing unit), yang menyebabkan data harus dipindahkan bolak-balik, menimbulkan latensi dan konsumsi daya yang tinggi, sementara RTX Spark memungkinkan CPU dan GPU berbagi pool memori hingga 128GB, dengan bandwidth internal tertinggi 600GB/detik melalui teknologi interkoneksi generasi kedua Nvidia. Desain ini secara drastis menghilangkan hambatan transfer data, memungkinkan GPU mengakses memori sistem berkapasitas besar secara langsung, mendukung jalannya model AI super besar.

Nvidia memberikan indikator kinerja RTX Spark di berbagai skenario utama: menjalankan model bahasa besar dengan 1200 miliar parameter secara lokal, mendukung 1 juta token (kata dasar) dalam konteks; menjalankan game AAA pada resolusi 1440p/100FPS; mengedit video 12K 4:2:2 secara lancar. Di antara semua, kemampuan menjalankan model dengan 1200 miliar parameter secara lokal sangat penting — pengguna tidak perlu koneksi internet, tidak perlu membayar biaya cloud, dan dapat menjalankan model bahasa besar setara GPT-3.5 di laptop, mendukung seluruh novel panjang atau ratusan halaman dokumen profesional dalam konteks.

Dari "Perangkat Lunak Operasi" ke "Ekspresi Kebutuhan"

Jensen Huang dalam pidatonya menyebutkan perbedaan inti antara komputer AI dan komputer tradisional: "Selama 40 tahun terakhir, orang membuka aplikasi, mengklik, dan memasukkan perintah untuk menyelesaikan pekerjaan. Dengan RTX Spark, pengguna cukup mengajukan kebutuhan, sisanya diserahkan ke PC untuk menyelesaikannya."

Ini menandai pergeseran konsep desain komputer, yang sebelumnya selalu berfokus pada "manusia", tetapi di masa depan orang mulai merancang komputer untuk agen AI. Ahli ekonomi digital Liu Xingliang mengatakan bahwa orang harus beralih dari "kemampuan mengoperasikan" ke "kemampuan mengekspresikan", dan kemampuan terpenting individu di masa depan mungkin akan menjadi bertanya, menilai, mencipta, dan memutuskan.

Mengingat tren instalasi dan penghapusan "kepiting" (OpenClaw) yang hampir bersamaan beberapa waktu lalu, alasannya adalah tagihan token yang tidak terkendali dan kekhawatiran terhadap keamanan. Penempatan model besar secara lokal secara sempurna menghindari kedua masalah ini — model dengan 1200 miliar parameter dapat dijalankan langsung di lokal, data tidak keluar dari mesin, jumlah penggunaan tidak terbatas dan tidak perlu membayar biaya.

Faktanya, sejak 2023, produk PC AI sudah muncul di pasar, tetapi mengapa industri menganggap tahun ini sebagai tahun pertama AI PC? Kuncinya adalah keinginan konsumen untuk membayar. Daya komputasi AIPC awal hanya 10—40 TOPS (triliun operasi per detik), hanya mampu menjalankan model kecil di bawah 7 miliar parameter, dengan kegunaan terbatas; produk berikutnya meningkat menjadi 40—60 TOPS, mampu menjalankan model 13—30 miliar parameter, tetapi AI masih seperti plugin. RTX Spark dirancang dari tingkat arsitektur chip khusus untuk AI Agent, dengan kekuatan komputasi AI lokal sebesar 1 PetaFLOP (setara 500 TOPS), mendukung model besar dengan 1200 miliar parameter — bagi konsumen biasa, pengalaman menggunakan model besar di PC sudah hampir setara dengan cloud, lebih aman, dan tidak perlu membayar token, sehingga keinginan membeli meningkat secara signifikan.

Respon pasar pun cepat: pada hari peluncuran RTX Spark, harga saham Nvidia naik 6,26%, ARM melonjak 15,73%, sementara Intel dan Qualcomm masing-masing turun 4,67% dan 8,78%.

Menjalankan Model Besar Secara Lokal dengan "Full Power"

Peluncuran ini membuat perusahaan chip China bernama Houmo Intelligent sangat antusias, sebelumnya mereka kesulitan meyakinkan pasar untuk menerima model besar dijalankan di terminal, dan ide desain RTX Spark sangat cocok dengan chip M50 mereka, yaitu siapa yang bisa menjalankan model besar yang lebih "full power" di komputer, dia akan memiliki kemampuan untuk menentukan aturan main seluruh kategori AI PC.

Cara Nvidia adalah mengintegrasikan CPU dan GPU ke dalam satu chip, sementara Houmo Intelligent M50 adalah chip arsitektur memori dan komputasi terpadu. Keduanya memiliki kesamaan, yaitu melalui inovasi arsitektur, kekuatan komputasi AI dari fungsi pelengkap menjadi kemampuan utama chip.

Lenovo Rilis PC AI P7

Bulan lalu, Lenovo meluncurkan PC AI P7 yang dilengkapi dengan chip Houmo Intelligent M50, mampu menjalankan model besar lokal hingga 1220 miliar parameter secara lancar dalam bodi kecil sebesar telapak tangan. Wakil Presiden Penjualan bisnis PC Houmo Intelligent, Ni Xiaolin, mengatakan bahwa M50 adalah chip efisien yang dirancang khusus untuk inferensi model besar, mampu mencapai 160 TOPS dengan konsumsi daya rendah 10 watt, dan dengan memori besar serta bandwidth tinggi, sangat cocok untuk kebutuhan deployment lokal yang mengutamakan efisiensi daya dan kinerja tinggi.

Tak lama kemudian, perusahaan "perusahaan satu orang" Shanghai, Liaoqi Intelligent, bekerja sama dengan Houmo Intelligent untuk membuat pusat kecerdasan personal yang mendukung interaksi holografik, mampu mengatur jadwal, merangkum catatan, dan berlatih percakapan. Produk ini sudah digunakan di panti jompo di Distrik Huangpu, di mana orang tua dapat berinteraksi dengan keluarga mereka yang berada di luar kota melalui citra digital holografik.

Pusat kecerdasan personal holografik yang dibuat oleh Liaoqi Intelligent dan Houmo Intelligent.

Perusahaan NAS (Network Attached Storage) juga berharap menjadi pusat pengendali keluarga generasi berikutnya. Mereka ingin memanfaatkan kemampuan model besar yang terintegrasi di M50 untuk mengelola data pribadi yang tersimpan di NAS, menjadikannya pusat data pribadi yang lebih besar.

Data dari China Academy of Information and Communications Technology menunjukkan bahwa pada kuartal pertama 2026, tingkat penetrasi AI PC domestik mencapai 42%, melonjak 380% secara tahunan. Kita bisa menunggu peluncuran AI PC yang "mengubah aturan" pada musim gugur ini, atau menantikan berbagai produk terminal pintar yang akan berkembang pesat.

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

2 Suka