Mengapa pusat data AI tidak bisa hanya bergantung pada GPU? Analisis mekanisme kolaborasi memori, jaringan, dan penyimpanan.

Question

Pada Juni 2026, Bitcoin berfluktuasi di sekitar level $60.000, Ethereum berkisar di $1.600, dan pasar kripto berada dalam fase bottoming sementara. Namun sektor lain—infrastruktur pusat data AI—menunjukkan panas yang sangat berbeda. Gartner memperkirakan pengeluaran TI global pada tahun 2026 akan mencapai $6,31 triliun, naik 13,5% tahun-ke-tahun, dengan pengeluaran sistem pusat data memimpin semua kategori dengan pertumbuhan 55,8%. IDC memperkirakan pengeluaran global perusahaan untuk AI pada tahun 2026 akan mencapai $940 miliar.

Dalam perlombaan senjata komputasi ini, terjadi perubahan kognitif kunci: daya saing pusat data AI tidak lagi hanya bergantung pada jumlah GPU dan puncak daya komputasi, tetapi semakin bergantung pada kemampuan koordinasi keseluruhan komputasi, penyimpanan, dan jaringan di dalam klaster. Memahami bagaimana Memory, Networking, dan Storage bekerja sama telah menjadi keterampilan dasar dalam mengevaluasi nilai investasi infrastruktur AI.

Dinding Memori: Hambatan Pertama di Era Model Besar

Skala parameter model AI besar telah mengalami pertumbuhan eksponensial dalam dua tahun terakhir. Dari 2024 hingga 2026, jumlah parameter model utama melonjak seratus kali lipat, dan jendela konteks diperluas dari puluhan ribu karakter menjadi jutaan karakter. Namun, bandwidth memori server meningkat kurang dari 15% per tahun, jauh tertinggal dari pertumbuhan bisnis AI. Ketidaksesuaian yang parah dalam laju iterasi perangkat lunak dan keras ini menjadikan 'dinding memori' sebagai hambatan inti dalam melepaskan daya komputasi AI.

Apa yang disebut dinding memori pada dasarnya adalah kecepatan peningkatan daya komputasi CPU/GPU yang jauh melampaui kecepatan peningkatan bandwidth baca/tulis memori dan latensi. Chip komputasi beroperasi sangat cepat, tetapi akses data tidak dapat mengimbangi, menyebabkan prosesor berada dalam keadaan idle menunggu untuk waktu yang lama. Menurut laporan pengujian industri, hambatan I/O data dalam klaster sepuluh ribu kartu menyebabkan waktu tunggu GPU mencapai lebih dari 40%—ini berarti hampir setengah dari waktu chip komputasi mahal dihabiskan untuk menunggu pemindahan data.

Tingkat kelangkaan sumber daya memori juga sangat mengejutkan. Konsumsi DRAM dan HBM dari satu server inferensi AI adalah lebih dari sepuluh kali lipat dari server pusat data tradisional, dan hampir 60% kapasitas wafer DRAM global telah ditempati oleh klaster AI. HBM bahkan berada dalam status pesanan terkunci dan kekurangan pasokan untuk waktu yang lama, dengan kapasitas utama telah dikunci oleh pelanggan besar hingga tahun 2026 atau bahkan 2027. Gartner menunjukkan bahwa permintaan yang kuat ditambah dengan hambatan pasokan telah mendorong harga HBM ke rekor tertinggi, dan kenaikan harga yang cepat membuat memori menjadi area keuntungan tinggi di mata produsen semikonduktor.

Untuk memecahkan dinding memori, industri sedang bergerak di sepanjang dua jalur: pertama, penjadwalan yang cermat dan optimasi kompresi di tingkat perangkat lunak, dengan mengaktifkan sumber daya penyimpanan yang ada melalui penjadwalan berlapis cache KV, kompresi kuantisasi bit rendah, dll.; kedua, rekonstruksi arsitektur di tingkat perangkat keras, termasuk iterasi HBM, implementasi protokol interkoneksi memori baru seperti CXL (Compute Express Link). Platform HGX Rubin generasi baru Nvidia telah meningkatkan bandwidth memori GPU sebesar 3 kali lipat menjadi 176 TB/s. Kedua jalur ini bukanlah hubungan substitusi, melainkan skema komplementer yang secara kolaboratif membentuk kembali logika kerja sama antara penyimpanan dan daya komputasi di seluruh rantai industri.

Jaringan: 'Jaringan Saraf' dari Klaster AI

Jika memori memecahkan efisiensi pemindahan data dalam satu node, maka jaringan memecahkan masalah aliran data antar node. Dalam klaster AI skala besar, ratusan hingga ribuan GPU perlu bekerja sama untuk menyelesaikan tugas pelatihan atau inferensi model, dan efisiensi komunikasi antar GPU secara langsung mempengaruhi kecepatan pelatihan keseluruhan.

Hambatan bandwidth saat ini bersifat multi-level: di antara chip, interkoneksi on-board PCB tradisional tidak dapat memenuhi kebutuhan bandwidth tinggi dan latensi rendah chip AI; di dalam rak, bandwidth interkoneksi antar server menjadi kendala untuk ekspansi vertikal; di antara pusat data, bandwidth dan latensi transmisi jarak jauh membatasi efisiensi ekspansi horizontal dan penjadwalan daya komputasi lintas wilayah. Menurut perkiraan, dalam klaster pelatihan AI saat ini, konsumsi energi pemindahan data telah melampaui konsumsi energi komputasi itu sendiri.

NVLink dan InfiniBand dari Nvidia telah lama mendominasi pasar interkoneksi internal klaster AI. NVLink Switch terbaru mereka memiliki bandwidth 28,8 TB/s, dua kali lipat dari generasi sebelumnya. Namun, lanskap ini sedang ditantang—AMD, Broadcom, dan vendor lainnya mendorong solusi interkoneksi mereka sendiri, dan standar terbuka seperti UALink (Ultra Accelerator Link) juga semakin terbentuk. Jalur jaringan tahun 2026 telah beralih dari 'eksklusif Nvidia' menjadi 'kompetisi multi-standar', yang menuntut kemampuan integrasi sistem yang lebih tinggi dari operator pusat data.

Penyimpanan: Dari 'Gudang' ke 'Pipa Data'

Di pusat data tradisional, peran penyimpanan adalah 'gudang data'—terutama untuk penyimpanan dan pengarsipan data dingin. Namun di pusat data AI, peran penyimpanan telah ditingkatkan menjadi 'pipa data'—perlu mengirimkan data pelatihan ke node komputasi dengan kecepatan sangat tinggi dan mendukung pembacaan parameter model latensi rendah dalam skenario inferensi.

Pelatihan AI membutuhkan pembacaan cepat data mentah dalam jumlah besar, sedangkan inferensi membutuhkan akses cepat ke bobot model dan cache KV. Cache KV mulai diperluas dari GPU HBM ke DRAM sistem, dan bahkan lebih jauh ke SSD berkecepatan tinggi lokal. Ini berarti batas antara penyimpanan dan memori semakin kabur, perangkat penyimpanan tidak lagi hanya menjadi titik akhir data, tetapi simpul kunci dalam pipa aliran data.

Penyimpanan all-flash sedang menggantikan hard disk mekanis tradisional sebagai pilihan utama untuk pusat data AI. Produk penyimpanan all-flash dan jaringan interkoneksi berkecepatan tinggi asli yang dipamerkan oleh Sugon di ISC High Performance 2026 adalah catatan industri dari tren ini. Kinerja penyimpanan secara langsung menentukan apakah data dapat dikirimkan ke unit komputasi tepat waktu, sehingga menentukan tingkat pemanfaatan GPU.

Sinergi 'Komputasi-Penyimpanan-Jaringan': Dari Terobosan Titik Tunggal ke Optimasi Sistem

Setelah memahami peran dan hambatan masing-masing dari ketiganya, arti 'sinergi' menjadi jelas: daya komputasi nyata dari pusat data AI bukanlah jumlah sederhana dari daya komputasi GPU, bandwidth memori, throughput jaringan, dan IOPS penyimpanan, melainkan output efektif setelah keempatnya digabungkan pada tingkat sistem.

Pertumbuhan parameter model besar yang berkelanjutan melahirkan klaster AI super, dan kegunaan daya komputasi tidak lagi hanya bergantung pada kinerja chip, tetapi semakin bergantung pada kemampuan dan efisiensi koordinasi keseluruhan komputasi, penyimpanan, dan jaringan di dalam klaster. Penilaian ini sedang menjadi konsensus industri.

Dari praktik industri, desain 'komputasi-penyimpanan-jaringan' yang tergabung erat telah menjadi strategi standar vendor terkemuka. Sugon scaleX AI superklaster menganut konsep desain komputasi-penyimpanan-jaringan yang tergabung erat, secara signifikan meningkatkan efisiensi pelatihan dan inferensi. Sistem operasi inferensi Dynamo 1.0 Nvidia yang dipasangkan dengan platform BlueField-4 CMX menghubungkan berbagai lapisan media: GPU, HBM, DRAM host, flash lokal, penyimpanan jarak jauh, dengan mengandalkan pemisahan otomatis data panas-dingin untuk memecah pulau memori kartu tunggal.

Dalam laporan Juni 2026, IDC dengan jelas menunjukkan bahwa keunggulan kompetitif di bidang AI telah bergeser: kuncinya bukan lagi memiliki daya komputasi terkuat, tetapi bagaimana mengubah AI menjadi kemampuan bisnis yang berkelanjutan dengan biaya Token terendah. Dan komponen inti dari biaya Token adalah efisiensi gabungan dari komputasi, memori, jaringan, dan penyimpanan.

Lanskap Pasar: Siapa yang Diuntungkan?

Tren industri ini telah tercermin sepenuhnya di pasar modal.

Di sisi memori, SK Hynix tidak diragukan lagi adalah target paling cemerlang di tahun 2026. Pada 22 Juni 2026, saham SK Hynix melonjak 6%, mencapai rekor tertinggi baru 2.944.000 won Korea, melampaui Samsung sebagai yang teratas dalam kapitalisasi pasar saham Korea, dengan kenaikan lebih dari 349% sejak awal tahun. Micron juga menunjukkan kinerja yang kuat, dengan laporan keuangan kuartal terakhir pada minggu terakhir bulan Juni menunjukkan pendapatan meningkat lebih dari empat kali lipat tahun-ke-tahun, dan mengumumkan 16 perjanjian pasokan jangka panjang. Harga saham Micron melonjak 16% pada hari rilis laporan keuangan.

Di sisi jaringan, saham pemasok produk serat optik Corning mencapai rekor tertinggi baru pada minggu terakhir bulan Juni. Posisi kunci produk serat optiknya di pusat data AI sedang dinilai kembali oleh pasar. Pesanan infrastruktur AI Cisco telah melampaui $9 miliar.

Di sisi server dan integrasi sistem, pendapatan kuartal tunggal server yang dioptimalkan AI Dell mencapai $16,1 miliar, naik 757% tahun-ke-tahun. Supermicro menguasai sekitar 70% pangsa pasar dalam teknologi pendingin cair langsung.

Di sisi operasi pusat data, BOCOM International menempatkan GDS (GDS-SW) dan SUNeVision (SUNEVISION) sebagai target beli utama di sektor pusat data, percaya bahwa AI generatif telah memicu pertumbuhan eksplosif di sisi permintaan. UBS juga menunjukkan bahwa industri pusat data internet China akan mulai mengalami percepatan signifikan pada paruh kedua tahun 2026.

Bagaimana Berpartisipasi dalam Investasi Infrastruktur AI melalui Platform Gate?

Platform Gate telah mendaftarkan lebih dari 12.500 saham dan ETF di pasar seperti AS, Hong Kong, dan Korea. Investor dapat berpartisipasi langsung dalam perdagangan saham global menggunakan aset digital seperti USDT melalui akun terpadu, mewujudkan alokasi terpadu aset kripto dan sekuritas tradisional.

Di bidang infrastruktur pusat data AI, Gate telah mencakup target dari chip hingga aplikasi di seluruh rantai industri:

Di saham AS, investor dapat memperdagangkan perusahaan inti seperti Nvidia (NVDA), AMD, Micron (MU), Broadcom (AVGO), Dell (DELL), Super Micro Computer (SMCI), Corning (GLW), Cisco (CSCO), dll. Gate mendukung perdagangan pra-pasar dan pasca-pasar, dengan jam perdagangan diperpanjang menjadi 16×5, memungkinkan pengguna merespons laporan keuangan perusahaan dan data makro secara lebih tepat waktu.

Di saham Hong Kong, perhatikan operator pusat data seperti GDS (09698.HK) dan SUNeVision (01686.HK).

Di saham Korea, SK Hynix (000660.KS) adalah pemimpin mutlak di bidang HBM; Jeju Semiconductor memainkan peran hulu kunci dalam bahan komunikasi optik pusat data AI.

Perdagangan saham Gate mendukung biaya serendah 0,1%, perdagangan leverage dan mode spot ganda, pengguna dengan kepemilikan $2.000 dapat menikmati tarif khusus VIP. Bagi investor yang ingin mengalokasikan jalur infrastruktur pusat data AI secara sistematis, kemampuan perdagangan satu atap lintas pasar dan multi-aset yang disediakan oleh Gate sedang menurunkan hambatan untuk alokasi aset teknologi global.

Penutup

Pusat data AI sedang beralih dari era 'menumpuk GPU' yang kasar ke era 'optimasi sistem' yang halus. Memori, jaringan, dan penyimpanan tidak lagi menjadi komponen infrastruktur yang terisolasi, tetapi merupakan variabel sistem yang bersama-sama menentukan output nyata daya komputasi AI dalam kerangka sinergi 'komputasi-penyimpanan-jaringan'.

Memahami logika ini tidak hanya membantu mengevaluasi tren teknologi, tetapi juga memberikan kerangka analisis yang lebih kuat untuk keputusan investasi—dari chip ke memori, dari jaringan ke penyimpanan, dari server ke operasi pusat data, penilaian kembali seluruh rantai industri baru saja dimulai. Dan ketika volatilitas jangka pendek pasar kripto bertemu dengan narasi jangka panjang infrastruktur AI, jendela alokasi yang melintasi aset digital dan industri fisik sedang terbuka.

FAQ

Q1: Mengapa pusat data AI tidak dapat mengandalkan penumpukan GPU saja untuk memecahkan masalah daya komputasi?

GPU hanyalah terminal output daya komputasi, dan efektivitasnya sangat bergantung pada apakah bandwidth memori dapat memasok data tepat waktu, apakah jaringan dapat mengoordinasikan paralelisme multi-kartu secara efisien, dan apakah penyimpanan dapat merespons pembacaan/penulisan data dalam jumlah besar dengan cepat. Hambatan I/O data dalam klaster sepuluh ribu kartu menyebabkan waktu tunggu GPU mencapai lebih dari 40%—menumpuk GPU begitu saja tanpa menyelesaikan sinergi ketiganya menghasilkan pemborosan daya komputasi yang luar biasa.

Q2: Mengapa HBM sangat langka?

HBM (High Bandwidth Memory) adalah memori standar untuk chip AI, dengan proses manufaktur yang kompleks dan siklus ekspansi kapasitas lebih dari dua tahun. Pada tahun 2026, permintaan inferensi AI melampaui skenario pelatihan, semakin mendorong permintaan untuk HBM dan DRAM kapasitas besar. Kapasitas utama telah dikunci oleh pelanggan besar hingga tahun 2026 atau bahkan 2027, dengan elastisitas pasokan jangka pendek yang sangat terbatas.

Q3: Apa logika inti dari investasi infrastruktur pusat data AI?

Logika inti adalah pergeseran dari 'didominasi pelatihan' ke 'ledakan permintaan full-stack'. Empat raksasa teknologi—Microsoft, Google, Amazon, Meta—memiliki total belanja modal infrastruktur AI sebesar $725 miliar pada tahun 2026. Skala dana ini tidak dapat ditanggung oleh satu tautan saja; seluruh rantai industri—dari chip, memori, jaringan hingga operasi pusat data—berada dalam siklus manfaat struktural.

Q4: Bagaimana cara memperdagangkan saham terkait pusat data AI di platform Gate?

Gate telah mendaftarkan lebih dari 12.500 saham dan ETF di pasar AS, Hong Kong, dan Korea. Pengguna dapat menyetor aset digital seperti USDT dan memperdagangkan target inti infrastruktur AI seperti Nvidia, Micron, SK Hynix di akun terpadu, mendukung perdagangan pra-pasar dan pasca-pasar, mode leverage dan spot, dengan biaya serendah 0,1%.

Q5: Apa saja risiko investasi dalam infrastruktur pusat data AI?

Risiko utama meliputi: pertama, ketidaksesuaian pasokan-permintaan dapat menyebabkan kelebihan pasokan sementara—BOCOM International menunjukkan perlunya memperhatikan ketidaksesuaian pasokan-permintaan sementara dan fluktuasi valuasi yang mungkin terjadi dalam siklus yang lebih panjang; kedua, masalah keberlanjutan belanja modal penyedia layanan cloud skala besar—JP Morgan menunjukkan bahwa pertumbuhan belanja modal pada 2025-2026 jauh melampaui pertumbuhan pendapatan aktual, memberikan tekanan pada arus kas; ketiga, gangguan geopolitik dan kontrol ekspor pada rantai pasokan chip proses canggih.

BTC-1,27%

ETH0,21%

Lihat Asli

Mengapa pusat data AI tidak bisa hanya bergantung pada GPU? Analisis mekanisme kolaborasi memori, jaringan, dan penyimpanan.

Dinding Memori: Hambatan Pertama di Era Model Besar

Jaringan: 'Jaringan Saraf' dari Klaster AI

Penyimpanan: Dari 'Gudang' ke 'Pipa Data'

Sinergi 'Komputasi-Penyimpanan-Jaringan': Dari Terobosan Titik Tunggal ke Optimasi Sistem

Lanskap Pasar: Siapa yang Diuntungkan?

Bagaimana Berpartisipasi dalam Investasi Infrastruktur AI melalui Platform Gate?

Penutup

FAQ

Topik Trending

SKHynixTopsKOSPIByMarketCap

GateCompletesDividendDistribution

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

SolanaEcosystemANSEMSurges

Disematkan