Penyimpanan tiba-tiba mendapat pukulan keras, tetapi AI belum melepaskan tangan untuk merebut barang

MaticHoleFiller · 2026-04-03T06:39:46+00:00

> 炒股就看金麒麟分析师研报，权威，专业，及时，全面，助您挖掘潜力主题机会！（Sumber: China Fund News）“Pada tahap saat ini, mengunci kapasitas produksi lebih penting daripada membahas harga.”Penulis: Niu SiruoBerita teknologi dari Google tentang “pengurangan penggunaan memori menjadi 1/6 dari sebelumnya” membuat seluruh sektor penyimpanan global berkeringat dingin.Baru-baru ini, Google meluncurkan algoritma kompresi TurboQuant, yang tanpa mengorbankan akurasi model, mengurangi kebutuhan ruang “cache kunci-nilai” (KV Cache) yang paling banyak digunakan selama inferensi AI menjadi 1/6 dari sebelumnya, dan meningkatkan kecepatan perhitungan perhatian hingga 8 kali lipat.Setelah berita ini muncul, pasar segera menafsirkannya sebagai “akan berdampak pada permintaan keseluruhan chip penyimpanan untuk kecerdasan buatan,” dan dengan cepat menyebar.

MaticHoleFiller

2026-04-03 06:39:46

Berkecimpung di saham, lihat laporan riset analis Golden Qilin; berwenang, profesional, tepat waktu, lengkap—membantu Anda menggali peluang tema berpotensi!

（Sumber: China Fund News）

“Pada tahap saat ini, lebih penting mengunci kapasitas daripada membicarakan harga.”

Penulis: Niu SiRuo

Satu kabar teknis dari Google tentang “penggunaan memori turun menjadi 1/6” mengguncang habis-habisan sektor penyimpanan global, sampai membuatnya “berkeringat dingin”.

Dalam waktu dekat, Google meluncurkan algoritma kompresi TurboQuant. Algoritma ini, tanpa mengorbankan ketepatan akurasi model, menurunkan kebutuhan ruang “key-value cache” (KV Cache) yang paling menguras sumber daya pada tahap inferensi AI menjadi 1/6, serta meningkatkan kecepatan perhitungan attention sebanyak 8 kali.

Begitu kabar itu keluar, pasar dengan cepat menafsirkannya sebagai “akan menekan permintaan keseluruhan untuk chip penyimpanan akibat AI”, lalu dengan cepat merembet ke pasar modal, sehingga saham-saham konsepsi chip penyimpanan melemah secara kolektif.

Di saat yang sama, topik “harga modul memori yang jatuhnya seperti tebing” naik ke daftar teratas pencarian ramai. Perpaduan antara pelonggaran harga dari jalur distribusi, gangguan teknis, dan koreksi pada sektor, membuat pasar kembali mempertanyakan: apakah siklus penyimpanan ini sudah sampai di titik belok?

Pelacakan lokal dari sisi kanal: “pelonggaran”

Penurunan harga modul memori yang banyak dibahas ini lebih banyak terjadi di kanal spot, terutama ditujukan bagi pemain individu yang memiliki kebutuhan perakitan mandiri (self-assemble).

Ukuran pasar seperti ini pada dasarnya terbatas, sehingga lebih sensitif terhadap fluktuasi harga dan sentimen konsumsi. Pedagang kanal harus melihat penawaran dari hulu, sekaligus mempertimbangkan apakah pengguna di sisi C benar-benar membayar.

Seorang pemilik toko yang khusus menjual modul memori di Huaqiangbei mengatakan kepada reporter bahwa sejak hari Rabu pekan lalu, beberapa produk memori sudah mulai turun harga. Saat ini, harga memori 16G turun dari kisaran 900 yuan minggu lalu menjadi sekitar 700 yuan, dan harga memori 32G juga pada dasarnya turun sekitar 300 yuan.

Harga anjlok dan saham jatuh terlampau dalam memang menimbulkan kesan keliru bahwa “tren sudah mencapai puncaknya”. Menurut kalangan industri, ini lebih mirip koreksi singkat dari pasar kanal terhadap kenaikan yang terlalu cepat di periode sebelumnya, bukan pembalikan tren industri.

“Karena kenaikan harga pada periode sebelumnya terlalu besar, sentimen penolakan pelanggan kanal terhadap produk penyimpanan berharga tinggi semakin kuat; transaksi aktual di pasar pun semakin sulit. Lebih penting lagi, di sisi perdagangan spot, pihaknya ingin menarik kembali dana dan mewujudkan keuntungan, sehingga penjualan modul DDR4 kelas bawah di sisi perdagangan cukup banyak, yang semakin mengguncang dan menekan pasar kanal.” kata seorang analis pasar.

Namun jika dilihat dari pasar kontrak, ada gambaran lain. Menurut narasumber tersebut, pada kuartal I tahun ini, harga kontrak server dan PC NAND serta DRAM dari pabrikan (original) meningkat berlipat ganda.

Narasumber tersebut menyatakan bahwa saat ini produk penyimpanan belum bisa sepenuhnya memenuhi kebutuhan pasar; masalah kekurangan pasokan penyimpanan sulit untuk segera ditangani dalam waktu dekat. Karena itu, koreksi harga di pasar kanal tidak akan mengubah keseluruhan logika kenaikan (uptrend) dalam industri penyimpanan.

“Tanpa memori, tidak ada AI”

Hampir pada waktu yang sama, di lokasi konferensi puncak MemoryS 2026 di Shenzhen, udara dipenuhi oleh emosi yang berbeda.

“Semua orang menanyakan apakah ada stok untuk saya; bahkan yang penting hanya ada stok, tidak menanyakan harga.” seorang petugas penjualan dari perusahaan peserta pameran penyimpanan tertawa pahit kepada reporter, “tapi sekarang pun kami hanya mampu memenuhi sekitar tiga sampai empat puluh persen kebutuhan; kalau dapat pesanan dengan volume terlalu besar, terpaksa kami tolak.”

Pasar khawatir permintaan akan melemah, tetapi yang terasa di lokasi konferensi puncak industri justru tetap ketatnya pasokan. Di aula yang penuh sesak, salah satu topik terpanas adalah: “industri penyimpanan kekurangan stok ini harus berlangsung lagi sampai berapa lama?”

Manajer umum pasar flash, Tai Wei, mengatakan: “AI bukan hanya tren, melainkan revolusi di tingkat dasar. AI sedang mengubah penyimpanan dari pos biaya dalam daftar BOM menjadi sumber daya strategis dalam ajang kompetisi AI; dari produk yang bersifat periodik menjadi kekuatan kompetitif inti dalam ekonomi digital.”

Ini bukan berlebihan.

Baik pelatihan model besar, inferensi, fine-tuning, maupun aplikasi multimodal, setiap tahap mendorong bandwidth dan kapasitas penyimpanan sampai batas maksimal. HBM yang sebelumnya hanya produk bernilai tinggi kelas niche kini, dalam satu langkah, menjadi “minyak” di era AI; memori DDR5 berkapasitas besar juga berubah dari konfigurasi opsional menjadi standar konfigurasi untuk server AI; SSD enterprise juga bukan sekadar wadah kapasitas, melainkan kunci untuk memecahkan bottleneck performa dalam arsitektur komputasi.

Tai Wei menjelaskan bahwa saat model besar melakukan inferensi, perlu menyimpan hasil Key Value untuk setiap lapisan dan setiap Token agar tidak menghitung ulang, sehingga memperpendek waktu respons. Ketika konteks diperpanjang dari 4K Token menjadi 128K Token, kebutuhan ruang KV cache akan membesar berkali-kali; ditambah lagi dengan permintaan paralel yang tinggi, kebutuhan akan cepat meningkat ke skala yang besar. Mengandalkan HBM saja sudah sulit menampungnya, sehingga semakin banyak tekanan mulai berpindah ke NVMe SSD.

“Justru karena itulah, permintaan SSD yang dioptimalkan untuk beban inferensi AI tumbuh sangat cepat, dan eSSD menjadi pasar aplikasi terbesar NAND pada tahun 2026.” tegas Tai Wei.

“Tanpa memori, tidak ada AI.” penilaian CEO Phison Electronics, Pan Jiancheng, bahkan lebih langsung. Menurutnya, algoritma kompresi yang diluncurkan Google tidak berarti permintaan penyimpanan akan runtuh secara linear. Sebaliknya, teknologi kompresi berarti biaya host turun, jumlah pengiriman naik, dan juga berarti pengguna bisa menghasilkan lebih banyak Token, yang kemudian membawa lebih banyak kebutuhan penyimpanan dan pemanggilan.

Morgan Stanley juga berpendapat bahwa dengan menurunkan secara drastis biaya layanan per kueri, TurboQuant memungkinkan model yang semula hanya bisa dijalankan pada klaster mahal di cloud untuk bermigrasi ke perangkat lokal. Ini secara efektif menurunkan ambang batas untuk penyebaran AI dalam skala besar, yang kemungkinan justru akan semakin mendorong permintaan keseluruhan.

Perluasan kapasitas menunggu, kekurangan stok sulit diatasi

“Meski pabrikan penyimpanan sekarang sudah mulai menambah belanja modal baru dan memperluas kapasitas, siklus ekspansi kapasitas industri penyimpanan berlangsung 18 hingga 24 bulan, dan kapasitas baru paling cepat dilepas pada tahun 2027.” kata Tai Wei kepada reporter. Masalah kekurangan pasokan penyimpanan, menurutnya, sulit untuk membaik dalam waktu dekat.

Menurutnya, pada tahun 2026 tidak ada satu pun produk penyimpanan AI arus utama di seluruh dunia yang bisa mewujudkan keseimbangan sempurna antara pasokan dan permintaan. Fokus industri penyimpanan sudah bergeser dari “lihat siapa yang termurah” menjadi “lihat siapa yang bisa mendapatkan stok.”

“Pada tahap saat ini, mengunci kapasitas lebih penting daripada membicarakan harga.” kata Tai Wei terus terang.

Pihak manajemen perusahaan pengendali penyimpanan (storage controller) terkemuka, Phison? (Hui Rong Technology/慧荣科技) juga mengatakan bahwa tahun 2026 belum masuk “waktu paling gelap”; pada tahun 2027, kekurangan pasokan dan permintaan akan semakin melebar, karena kenaikan harga kali ini dan kekurangan stoknya bukan sekadar fluktuasi siklik, melainkan perubahan struktural yang didorong oleh AI. Lagi pula, data dalam jumlah besar yang dihasilkan dari pelatihan dan inferensi AI terhadap permintaan penyimpanan adalah sesuatu yang belum pernah terjadi sebelumnya.

Satu sisi tertekan, sisi lain naik ke atas

Maka, muncul diferensiasi yang lebih nyata.

Bagi pasar konsumsi tradisional seperti ponsel dan PC, kenaikan harga penyimpanan pertama-tama tercermin sebagai tekanan biaya. Beberapa vendor penyimpanan mulai memilih jalur “value for money (hemat biaya)”, mencoba mencapai pengalaman setara yang lebih tinggi dengan penggunaan memori yang lebih sedikit.

Sebagai contoh, Jiangbo Long sedang mencoba mendorong penerapan AI PC dan sisi embedded dalam seluruh skenario dengan integrasi mendalam HLC advanced cache technology serta SPU dan UFS. Di saat mengoptimalkan pengalaman AI, langkah ini juga menurunkan kebutuhan dan biaya terminal terhadap kapasitas DRAM; Phison Electronics meluncurkan Phison Hybrid AI SSD dan teknologi aiDAPTIV+. Diperkirakan bisa mengurangi penggunaan DRAM lebih dari 50%, sehingga biaya bisa dikendalikan dan inferensi lokal tetap aman.

Sementara itu, di sisi lain, semua orang justru “bergerak ke atas” secara kolektif—sumber daya dan kapasitas prioritas mengalir ke produk teknologi tinggi, bernilai tinggi, dan berhambatan masuk (high barrier) yang tinggi.

Dulu, sorotan industri AI tertuju pada “pelatihan”. Memang throughput klaster komputasi sangat mengesankan, tetapi permintaan sering kali bersifat per tahap. Kini, pusat gravitasi industri bergeser sepenuhnya ke “inferensi”—sebuah “lubang tanpa dasar” yang lebih berfrekuensi tinggi, lebih rinci, dan lebih menempel pada aliran bisnis nyata.

Berdasarkan data terbaru dari National Data Bureau, pada bulan Maret tahun ini, panggilan Token harian rata-rata di China menembus 140 triliun. Dalam dua tahun terakhir, pertumbuhannya lebih dari seribu kali. Menurut Huang Renxun, AI tipe agen (agentic AI) berpotensi meningkatkan konsumsi Token sampai 1000 kali, sehingga membentuk “kesunyian komputasi” (compute vacuum) yang disebutnya.

Tai Wei berkata terus terang: “Kita bisa memastikan satu hal—siapa pun yang bisa menyelesaikan ‘daya (power) dan latensi pemindahan data di era AI’, dialah yang akan mendefinisikan dekade berikutnya. Penyimpanan akan masuk ke siklus super yang digerakkan oleh AI.”

Zhang Shiwann, Wakil Presiden Eksekutif Samsung Electronics dan Kepala Tim Pengembangan Platform Solusi, mengatakan bahwa penyimpanan berkinerja tinggi tidak lagi merupakan opsi yang bisa ada atau tidak; melainkan landasan inti yang menentukan efisiensi pengambilan keputusan sistem dan skala. Berdasarkan penilaian tersebut, Samsung sedang mendorong PCIe Gen6 solid-state drive PM1763, dan berencana merilis drive EDSFF kepadatan lebih tinggi pada rentang 2026 hingga 2027 untuk meningkatkan kapasitas per mesin serta bandwidth.

Tanan Hong, Kepala Bagian SSD di Yangtze Memory, menyinggung bahwa kompetisi AI telah berpindah dari tahap pelatihan yang menekankan “penimbunan (akumulasi tebal)” ke tahap inferensi yang menekankan “keluarnya (hasil) secara tipis/cepat”. Bottleneck bandwidth penyimpanan saat ini sangat membatasi pelepasan komputasi; ketersediaan klaster GPU saat ini hanya sekitar 50%.

Menurutnya, cara untuk memecahkan kebuntuan adalah kolaborasi komputasi-penyimpanan: dari sisi pelatihan, bisa bertumpu pada penyimpananCheckpoint QLC eSSD berkapasitas besar untuk meningkatkan efisiensi GPU; dari sisi inferensi, melalui caching bertingkat (layered cache) KV Cache dengan eSSD untuk menangani manajemen status konteks. Untuk skenario seperti ini, Yangtze Memory meluncurkan beberapa produk Gen5 enterprise-grade eSSD.

Bagi vendor penyimpanan, soal ujian yang sesungguhnya bukanlah apakah mereka bisa menaikkan harga, melainkan apakah mereka bisa berdiri pada lapisan nilai yang lebih tinggi.

Dari perang harga ke perang nilai, dari satu produk ke solusi full-stack, dari sekadar pelengkap komputasi hingga “kunci penentu menang-kalah AI”… Dalam kompetisi yang aturan mainnya ditulis ulang oleh AI, harga eceran sesekali melonggar—hanya riak di permukaan air; namun di dalam yang lebih dalam, chipnya tetap langka, dan sangat mahal.

Editor: Huang Mei; Proofreader: Wang Yue; Penanggung jawab: Chen Siyang

Arus informasi besar, interpretasi yang presisi—segalanya ada di aplikasi Sina Finance

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.