Penyesuaian sektor penyimpanan, apakah ini kesalahan pembunuhan atau keruntuhan logika?

Minggu ini, rilis teknologi baru dari Google langsung membuat sektor penyimpanan terkejut. Mengambil contoh Micron Technology, langsung mengalami lima penurunan berturut-turut, saham terkait di A-share juga mengalami penyesuaian yang sama.

TurboQuant, yang mengklaim dapat mengurangi kebutuhan penyimpanan KV Cache untuk teks panjang sebanyak 6 kali lipat dan meningkatkan kecepatan inferensi 8 kali lipat, setelah diluncurkan, saham penyimpanan langsung terjun bebas, banyak yang berteriak “Kebutuhan penyimpanan AI akan hilang.”

Tapi jika Anda berpikir lebih dalam, apakah ini terdengar sedikit familiar? Ketika teknologi GQA muncul pada tahun 2023, ada juga yang mengatakan bahwa kebutuhan KV Cache akan berkurang setengahnya, penyimpanan akan merosot; ketika PagedAttention muncul pada tahun 2024, argumen yang sama muncul lagi.

Hasilnya? Dalam dua tahun terakhir, konsumsi token model besar global telah langsung meningkat lebih dari 10 kali lipat, kebutuhan penyimpanan justru semakin meningkat.

01 Kebenaran TurboQuant: Kompresi Belum Tentu Merugikan

Banyak orang berpikir, kompresi 6 kali lipat berarti kebutuhan penyimpanan berkurang 6 kali lipat? Bukankah ini akan membunuh penyimpanan?

Jika Anda berpikir seperti itu, maka Anda telah membalik logika teknologi ini.

Secara sederhana, KV Cache adalah ketika model besar melakukan inferensi, perlu menyimpan konten percakapan sebelumnya, jika tidak, ia akan melupakan apa yang telah Anda katakan sebelumnya, hal ini menyita sebagian besar kebutuhan penyimpanan selama fase inferensi. Kompresi yang dilakukan oleh TurboQuant bertujuan untuk mengatasi hambatan inti dalam inferensi AI—dinding memori.

Saat ini, konteks model besar telah meningkat dari 4K menjadi 128K, bahkan permintaan inferensi yang bersamaan mencapai ratusan ribu, jika tidak melakukan kompresi, meskipun semua HBM ditumpuk, tetap tidak akan cukup, dan biaya pemindahan data jauh lebih tinggi daripada biaya komputasi, yang akan memperlambat kecepatan inferensi.

Oleh karena itu, kompresi bertujuan agar inferensi dengan konteks panjang dan permintaan tinggi dapat berjalan, bukan untuk mengurangi penggunaan penyimpanan.

Dan ini bukanlah hal baru, industri sudah mulai berinovasi.

GQA tahun 2023 telah mengompresi KV Cache sebanyak 4-8 kali; pada tahun 2024, kuantisasi dan PagedAttention mengompresi lagi sebanyak 2-4 kali, setiap kali ada yang mengatakan kebutuhan penyimpanan akan hilang, dan hasilnya?

Setiap kali setelah kompresi, orang-orang berani memperpanjang konteks, melakukan lebih banyak permintaan bersamaan, inferensi teks panjang yang sebelumnya tidak mampu dilakukan, kini menjadi mungkin, kebutuhan baru justru mengisi ruang yang dihemat dari kompresi, bahkan masih belum cukup.

Ini adalah efek Jevons dalam ekonomi, yang paling klasik adalah kompresi video: ketika H.264 dan H.265 muncul, kebutuhan penyimpanan video per unit berkurang setengahnya, hasilnya orang malah mulai membuat video HD 4K dan 8K, bahkan sekarang video berdurasi 10 menit bisa dengan mudah berukuran 10GB+, sehingga total kebutuhan penyimpanan video malah meningkat puluhan kali lipat.

Prinsip TurboQuant juga sama. Kompresi 6 kali lipat terlihat besar, tapi lihatlah pertumbuhan kebutuhan saat ini: pada Februari 2026, konsumsi token model besar global adalah 10 kali lipat dari tahun lalu, dan pada tahun 2028, total data global akan meningkat menjadi 394ZB, lebih dari 5 kali lipat dari 2020. Kompresi ini, di hadapan pertumbuhan kebutuhan eksponensial, sama sekali tidak berarti.

Lebih penting lagi, penurunan biaya akibat kompresi akan melepaskan lebih banyak kebutuhan baru.

Dahulu, inferensi konteks panjang terlalu mahal, banyak perusahaan tidak mampu, sekarang biaya turun, mereka berani menggunakannya, penyedia cloud juga berani membuka batasan konteks, membuka batasan permintaan bersamaan, dan akhirnya, total kebutuhan penyimpanan justru akan semakin meningkat.

Singkatnya, TurboQuant adalah optimasi di sisi penawaran, bukan hilangnya di sisi permintaan. Ini adalah optimasi yang dilakukan untuk mengatasi dinding memori di tengah kekurangan pasokan HBM.

Dalam jangka pendek, kesenjangan pasokan dan permintaan HBM tetap ada, bahkan karena pelepasan kebutuhan baru, kesenjangan ini akan semakin besar.

02 Siklus Panjang yang Menjanjikan, Tertimpa Black Swan Geopolitik

Sebenarnya, sebelum fluktuasi TurboQuant ini, industri penyimpanan sudah memasuki siklus kejayaan yang sangat tinggi, keseimbangan pasokan dan permintaan sudah sangat ketat.

Di sisi permintaan, ledakan AI telah menarik kebutuhan penyimpanan ke tingkat yang belum pernah terjadi sebelumnya.

Dulu, kebutuhan penyimpanan bergantung pada PC dan ponsel, sekarang, server AI dan aplikasi multimodal menjadi mesin baru.

Seedance 2.0 dari Byte, untuk membuat video 10 menit, konsumsi tokennya adalah puluhan kali lipat dibandingkan teks, arsitektur baru dari Nvidia secara langsung meningkatkan kebutuhan NAND dari tingkat TB ke tingkat PB, kapasitas satu rak langsung meningkat 5 kali lipat.

Para raksasa internet global sedang gila-gilaan meningkatkan infrastruktur komputasi, pada tahun 2026, belanja modal dari delapan CSP besar diperkirakan akan meningkat 25%, mencapai 500 miliar dolar, sebagian besar uang ini akan diinvestasikan dalam infrastruktur AI, penyimpanan adalah kebutuhan pokok yang paling penting di antaranya.

Sementara itu, di sisi penawaran, tiga raksasa penyimpanan luar negeri, Samsung, SK Hynix, dan Micron, sudah sangat ketat dalam kapasitas produksi.

Setelah mengalami kerugian pada siklus sebelumnya, sekarang mereka sangat berhati-hati dalam memperluas kapasitas, dan semua kapasitas baru diarahkan ke produk high-end yang menguntungkan seperti HBM dan DDR5, sementara kapasitas DRAM dan NAND kelas rendah justru menyusut.

Yang lebih menyakitkan adalah kapasitas HBM kelas tinggi sama sekali tidak bisa diperluas.

Membangun ruang bersih membutuhkan waktu 8-12 bulan, dan waktu pemulihan hasil produksi akan lebih lama.

Sekarang, inventaris dari tiga pabrikan utama sudah mencapai level terendah dalam sejarah, yaitu 3-5 minggu, artinya, setelah barang di tangan mereka habis terjual, batch berikutnya belum diproduksi, pasokan sudah sangat ketat.

Keseimbangan pasokan dan permintaan yang ketat ini telah membuat harga penyimpanan meningkat selama beberapa bulan terakhir.

Laporan keuangan terbaru Micron adalah bukti yang paling baik: FY26Q2, pendapatannya mencapai 23,86 miliar dolar, meningkat 196% year-on-year, laba bersih 14,021 miliar, meningkat 686% year-on-year, margin laba kotor operasional langsung mencapai 69%, inilah kekuatan siklus super.

Dan pada saat ini, konflik di Hormuz langsung menambah api pada ketegangan pasokan dan permintaan yang sudah sangat ketat ini.

Anda harus tahu, sebagian besar kapasitas penyimpanan global berada di Korea, Samsung dan SK Hynix menguasai 70% kapasitas DRAM global, sedangkan 70% impor minyak Korea tergantung pada Timur Tengah, hampir sepenuhnya melalui Selat Hormuz.

Lebih parahnya, gas langka yang diperlukan untuk produksi penyimpanan, seperti helium, 64,7% diimpor dari Qatar, sementara produksi helium Qatar sudah terhenti, mengurangi pasokan global sebesar 30%; ada juga neon, sebagian besar neon global berasal dari Iran, dan sekarang semua ini menjadi bom waktu dalam rantai pasokan.

Inilah kondisi terkini industri penyimpanan: logika panjang adalah siklus permintaan super yang dibawa oleh AI, pasokan yang kaku, harga terus meningkat; logika pendek adalah konflik geopolitik di Hormuz yang langsung menyentuh titik lemah kapasitas penyimpanan luar negeri, membuat pasokan yang sudah tegang menjadi semakin ketat.

03 Siapa yang Bisa Menangkap Kekurangan Pasokan Global Ini?

Banyak orang akan bertanya, lalu di saat seperti ini, peluang penyimpanan dalam negeri ada di mana? Segmen mana yang paling harus kita perhatikan?

Sebenarnya sangat sederhana, cukup fokus pada dua inti: pertama, temukan segmen yang paling rentan terhadap gangguan geopolitik dari pasokan luar negeri, kedua, temukan pemimpin lokal yang sudah melakukan terobosan teknologi dan siap dengan kapasitas produksi, hanya mereka yang dapat menangkap kekurangan yang tiba-tiba ini.

Pertama, adalah segmen terkait HBM dan DRAM kelas tinggi.

Pikirkan, kapasitas Samsung dan SK Hynix sudah terkunci oleh Nvidia, jika kapasitas mereka mengalami masalah karena energi atau bahan baku, siapa yang akan mengisi kekurangan ini?

Pertama-tama tentu saja adalah pabrikan chip penyimpanan dalam negeri di hulu, kapasitas mereka sedang cepat diperluas, hasil produksi sudah meningkat, dan mereka juga sedang berfokus pada penelitian dan pengembangan HBM, jika pasokan luar negeri mengalami masalah, klien mungkin akan mempercepat verifikasi produk dalam negeri.

Selain itu adalah segmen modul penyimpanan di tengah.

Misalnya, perusahaan seperti Jiangbolong dan Baiwei Storage, mereka sebelumnya sudah memiliki saluran pelanggan yang matang, jika pasokan wafer luar negeri mengalami masalah dan harga naik, mereka dapat bergantung pada kapasitas wafer dalam negeri untuk memberikan produk penyimpanan yang lebih stabil dan lebih murah kepada pelanggan.

Dulu, orang-orang menganggap rantai pasokan luar negeri sangat stabil, jadi mereka enggan mengambil risiko untuk beralih ke produk dalam negeri, tetapi konflik geopolitik ini langsung memberi peringatan kepada semua orang: ternyata rantai pasokan luar negeri juga bisa putus? Ternyata menaruh semua kapasitas di luar negeri itu berisiko besar?

Selain itu, kenaikan harga minyak membuat biaya perusahaan luar negeri melambung, keuntungan rasio biaya dari perusahaan dalam negeri menjadi semakin jelas.

Singkatnya, logika panjang dari penyimpanan adalah siklus permintaan super yang dibawa oleh AI, dan perlombaan pengganti produk dalam negeri yang berlangsung selama sepuluh tahun; pemicu pendek adalah konflik geopolitik kali ini, yang mempercepat seluruh proses.

Namun, mengingat bahwa kenaikan keseluruhan sektor sebelumnya sudah cukup besar, mungkin sudah mencerminkan harapan optimis pasar secara penuh, investasi selanjutnya perlu waspada terhadap berbagai risiko:

Risiko perkembangan AI tidak memenuhi harapan: saat ini, AI mendorong permintaan penyimpanan terus meningkat, jika kemajuan teknologi model besar tidak memenuhi harapan, ada risiko penurunan belanja modal AI, sehingga mempengaruhi permintaan.

Risiko penurunan harga penyimpanan: karena harga penyimpanan melonjak, saluran distribusi ada beberapa fenomena spekulasi dan penimbunan, jika spekulasi berlebihan mempengaruhi permintaan hilir, ada risiko penurunan harga.

Risiko perkembangan penelitian dan pengembangan tidak memenuhi harapan: perusahaan penyimpanan perlu terus melakukan pembaruan dan inovasi produk, jika pilihan strategi salah, dapat menyebabkan risiko kegagalan penelitian dan pengembangan.

04 Kesimpulan

Melihat sejarah industri penyimpanan global, setiap konflik geopolitik selalu mempercepat restrukturisasi rantai pasokan; setiap revolusi teknologi selalu memunculkan kebutuhan penyimpanan yang baru.

Saat ini, kita sedang berada di titik pertemuan antara revolusi AI dan restrukturisasi rantai pasokan, penyimpanan adalah jalur inti yang ditunjuk oleh kedua gelombang besar ini.

Tentu saja, investasi dalam setiap jalur tidak mungkin selalu mulus. Industri penyimpanan masih menghadapi risiko perubahan kebijakan perdagangan luar negeri, meningkatnya persaingan industri, dan teknologi yang tidak memenuhi harapan, yang juga mengharuskan kita untuk terus memantau perubahan industri, memisahkan yang palsu dari yang nyata, dan menemukan perusahaan yang benar-benar memiliki daya saing inti.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan