AI secara bersamaan menciptakan kekurangan dan kelebihan memori

robot
Pembuatan abstrak sedang berlangsung

3 月 29 日, Kehua Qiangbei dan pasar ritel AS secara bersamaan mengalami penurunan harga modul RAM yang sangat tajam. Set Corsair 32GB DDR5-6400 turun dari 490 dolar menjadi 380 dolar, dengan penurunan 22% dalam satu hari. Modul 32GB DDR5 frekuensi tinggi dalam negeri anjlok 800 yuan dalam satu minggu; para distributor panik dan menjual secara agresif. Ada dealer yang mengatakan, “Dalam sehari saja sudah turun lebih dari seratus yuan.”

Namun jika angka ini ditempatkan pada timeline yang lebih panjang, gambarnya benar-benar berbeda: meskipun sudah turun, harga DDR5 saat ini masih empat kali lipat dibanding Juli 2025. Ini adalah ketidaksesuaian pasokan-permintaan yang presisi dalam rantai industri AI sekali ini; kekuatan yang sama mula-mula menciptakan kelangkaan, lalu menciptakan kepanikan kelebihan pasokan.

Wahana roller coaster: naik 540% dalam delapan bulan, turun 22% dalam satu bulan

Pada Juli 2025, satu set modul DDR5-6000 berkapasitas mainstream 32GB di pasar ritel AS hanya seharga 77 dolar. Pada Januari 2026, harga untuk set yang sama melonjak menjadi 490 dolar. Dalam delapan bulan, kenaikannya mencapai 540%.

Kenaikan harga bukan karena konsumen tiba-tiba gila upgrade komputer. Menurut data TrendForce, pada kuartal pertama 2026, harga kontrak DRAM naik 90%-95% secara kuartal (q/q). Di antaranya, kenaikan PC DRAM melebihi 100%, sekaligus mencatat kenaikan kuartalan terbesar sepanjang masa. Yang mendorong semuanya adalah kebutuhan yang sangat haus akan jenis memori tertentu akibat pembangunan infrastruktur AI.

Lalu pada 25 Maret, Google meluncurkan algoritma kompresi bernama TurboQuant. Empat hari kemudian, harga memori ambruk.

Ke mana kapasitas produksi itu pergi? HBM memakan modul RAM-mu

Untuk memahami gelombang kenaikan harga ini, perlu dipahami dulu parameter teknis kunci. HBM (memori bandwidth tinggi, memori khusus untuk chip AI NVIDIA) mengonsumsi luas wafer per GB yang tiga kali lebih besar daripada DDR5 biasa. Menurut laporan Tom’s Hardware, artinya untuk wafer yang sama, produksi HBM hanya mampu menghasilkan sepertiga kapasitas DDR5.

Samsung, SK hynix, dan Micron, tiga raksasa manufaktur memori, membuat pilihan rasional menghadapi margin laba HBM yang tinggi: memindahkan hingga 40% kapasitas wafer proses mutakhir ke produksi HBM. Menurut data TrendForce, pada kuartal pertama 2026, profitabilitas DDR5 diperkirakan untuk pertama kalinya akan melampaui HBM3e, yang mencerminkan seberapa parah penekanan terhadap pasokan memori level konsumen.

Pilihan Micron paling agresif. Pada Desember 2025, perusahaan ini mengumumkan penutupan merek konsumen Crucial yang sudah beroperasi selama 29 tahun, sepenuhnya keluar dari pasar memori dan penyimpanan level konsumen, dan beralih total ke pelanggan perusahaan dan AI. Menurut pengumuman hubungan investor Micron, pendapatan total tahun fiskal 2025 mencapai 37,38 miliar dolar; pusat data dan aplikasi AI sudah mencapai 56% dari total pendapatan. Pasar konsumen, tidak layak dilakukan.

Kapasitas produksi HBM SK hynix sudah habis terjual hingga akhir 2026. Samsung berencana menaikkan kapasitas produksi HBM per bulan dari 170.000 wafer menjadi 250.000 wafer pada akhir 2026. Pabrik wafer baru (Samsung P4L dan SK hynix M15X) paling cepat baru bisa mencapai volume produksi pada 2027-2028. Dengan kata lain, kekurangan pasokan DRAM level konsumen bersifat struktural, bukan sesuatu yang bisa diatasi hanya dalam satu atau dua kuartal.

Garis besar berbalik, SK hynix mematahkan penguasa 40 tahun Samsung

Perpindahan kapasitas ini juga mengubah peta kekuatan dalam industri memori. Menurut data TrendForce, pada kuartal kedua 2025, SK hynix berhasil meraih 62% pangsa pasar HBM berkat ikatan yang sangat dalam dengan NVIDIA; Samsung hanya 17%, dan Micron 21%.

Yang lebih bernilai tonggak adalah pembalikan dari sisi pendapatan. Menurut laporan TrendForce Q3 2025, SK hynix untuk pertama kalinya memuncaki pendapatan DRAM per kuartal dengan 13,75 miliar dolar; Samsung menyusul dengan 13,50 miliar dolar. Selisih di antara keduanya hanya 250 juta dolar, tetapi ini adalah pertama kalinya dalam hampir 40 tahun Samsung kehilangan posisi teratas dalam pendapatan memori. Menurut laporan CNBC, profit operasi penuh tahun 2025 SK hynix juga untuk pertama kalinya melampaui Samsung.

Keunggulan lebih dulu HBM memberi SK hynix amunisi yang cukup, tapi kompetisi ini belum selesai. Samsung sedang mengejar ketat target volume produksi HBM4. Micron, meski meninggalkan pasar konsumen, laju pertumbuhan pendapatan di bidang perusahaan dan AI (q/q kuartal ketiga +53,2%) adalah yang tercepat di antara ketiga perusahaan.

Bagaimana sebuah algoritma bisa mengguncang logika kenaikan harga?

Pada 25 Maret, Google mempresentasikan algoritma TurboQuant di ICLR 2026. Algoritma ini melakukan satu hal: saat inferensi model bahasa besar, cache KV (key-value cache, bagian yang menggunakan memori paling banyak selama proses inferensi) dikompresi dari presisi FP16 menjadi 3-bit; konsumsi memori turun setidaknya 6 kali, sementara pada GPU H100 menghasilkan percepatan perhitungan perhatian hingga 8 kali. Menurut blog riset Google, pada lima benchmark long-context seperti Needle-in-a-Haystack, kehilangan presisi adalah nol.

Pasar cepat menghitung. Jika TurboQuant atau algoritma serupa diadopsi secara luas oleh perusahaan AI arus utama, kebutuhan tambahan AI inferensi terhadap DRAM akan menyusut secara signifikan. Narasi inti yang mendukung kenaikan harga memori selama setengah tahun terakhir justru adalah, “Pembangunan AI mengonsumsi terlalu banyak kapasitas memori.”

Empat hari kemudian, kepercayaan kanal runtuh.

Perlu dicatat bahwa TurboQuant menargetkan cache KV pada sisi inferensi AI, bukan kebutuhan HBM pada sisi training. Hubungan pasokan-permintaan HBM dalam jangka pendek tidak akan berubah karena satu algoritma optimasi inferensi. Namun pasar tidak selalu membedakan dua hal ini. Menurut laporan Sina Finance, pada fase awal sebelum kejatuhan tajam, banyak pihak kanal domestik yang masuk untuk menimbun barang di luar lingkaran karena kenaikan harga. Harga tinggi membuat penjualan ritel anjlok lebih dari 60%; penjualan berantai yang terjadi akibat ketegangan arus kas memperbesar penurunan.

Dalam satu rantai industri AI, semuanya sekaligus menciptakan kelangkaan memori dan kepanikan kelebihan pasokan. Kapasitas fisik HBM yang menekan pasokan membuat memori level konsumen kekurangan pasokan; terobosan efisiensi algoritma TurboQuant membuat ekspektasi kebutuhan memori AI turun drastis. Yang menciptakan kenaikan harga dan yang menciptakan kehancuran, adalah kekuatan yang sama.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan