Pada pertengahan Mei, periode jendela 90 hari penangguhan tarif, sebuah pertempuran untuk sumber daya inti daya komputasi tiba-tiba memanas.
"Harga server berfluktuasi dengan tajam, beberapa waktu lalu harga per unit telah meningkat 15%-20%. Dengan penangguhan tarif, kami berencana untuk menjual kembali dengan harga asli." Sebuah pemasok chip di daerah selatan mengungkapkan kepada Huxiu.
Sementara itu, sisi pasokan pasar juga menghadapi variabel baru. Tiger Sniff mendapatkan informasi eksklusif bahwa produk high-end seri Hooper dari Nvidia dan seri Blackwell telah diam-diam muncul di pasar domestik, di mana kemunculan yang pertama terjadi sekitar September 2024, sedangkan yang kedua baru saja terjadi. Eksekutif terkait dari Huari Zhikuan menyatakan, "saluran pengadaan sumber dari berbagai pemasok sangat bervariasi." Namun, jaringan rantai pasokan yang kompleks di balik ini sulit untuk dijelajahi.
(Catatan Huxiu: Mulai 17 Oktober 2023, pihak Washington secara bertahap menghentikan penjualan chip Nvidia ke China, termasuk A100, A800, H800, H100, H200; baru-baru ini, H20 dari seri Hooper yang terakhir dapat dijual ke China juga dimasukkan dalam daftar larangan ekspor.)
Di antaranya, seri premium Hooper dari NVIDIA biasanya merujuk pada H200, yang merupakan versi upgrade dari chip H100, yang harganya hanya lebih tinggi sekitar dua ratus ribu, tetapi efisiensinya lebih tinggi 30%. Sementara itu, seri Blackwell termasuk dalam seri premium NVIDIA, di mana B200 harganya mencapai lebih dari tiga juta, juga merupakan produk dengan "peredaran yang paling terbatas" saat ini, dengan jalur peredarannya yang lebih rahasia. Kedua model ini digunakan untuk pelatihan model besar, dan B200 bahkan "sulit didapat".
Melihat kembali ke garis waktu, pada bulan April 2024, sebuah foto bersama Huang Renxun dengan Ultraman (Sam Altman) dan co-founder OpenAI Greg Brockman beredar di Twitter. Di balik foto ini adalah titik pengiriman kunci untuk produk pertama H200 - CEO Nvidia Huang Renxun secara pribadi mengantarkan barang tersebut, dan OpenAI adalah pengguna pertama H200.
Dalam waktu singkat 5 bulan, berita tentang pasokan H200 datang dari seberang lautan. Saat ini, sudah ada pemasok di dalam negeri yang memiliki kapasitas pasokan 100 unit server H200 per minggu. Menurut pemasok tersebut, dengan dihentikannya produksi H100, permintaan pasar sedang beralih dengan cepat ke H200, dan saat ini pemasok yang menguasai pasokan H200 tidak lebih dari sepuluh, sehingga kesenjangan antara penawaran dan permintaan semakin melebar.
"Saat ini yang paling dibutuhkan di pasar adalah H200, dan menurut pengetahuan saya, ada sebuah perusahaan cloud yang baru-baru ini sedang mencari H200 di mana-mana." Seorang pemain berpengalaman di industri komputasi selama 18 tahun memberi tahu Huxiu, mereka telah lama menyediakan layanan komputasi untuk Baidu, Alibaba, Tencent, dan Byte.
Dalam perlombaan arms race daya komputasi ini, rantai transaksi diselimuti misteri. Salah satu penyedia daya komputasi terkemuka di dalam negeri menyatakan bahwa aturan penilaian daya komputasi yang berlaku di industri adalah bahwa dalam kontrak hanya dicantumkan unit daya komputasi "P", yang mengubah transaksi server menjadi transaksi daya komputasi yang abstrak. (Catatan: P adalah satuan pengukuran daya komputasi) Misalnya, ketika pihak pengguna daya komputasi melakukan transaksi dengan penyedia daya komputasi, mereka tidak akan langsung mencantumkan model kartu dalam kontrak, melainkan menggantinya dengan jumlah daya komputasi dalam P, yang berarti bahwa secara terbuka tidak akan mencantumkan model kartu tertentu.
Mendalami dasar rantai industri, jaringan perdagangan yang tersembunyi muncul ke permukaan. Sebelumnya, beberapa media mengungkapkan bahwa beberapa distributor di China melalui saluran pengadaan khusus, dengan banyak lapisan penjualan kembali dan pengemasan, mewujudkan "penawaran melingkar" server. Dan Tiger Sniff lebih lanjut memahami bahwa ada beberapa distributor yang mencari jalan lain, memanfaatkan perusahaan pihak ketiga, dengan cara menyisipkan modul ke dalam produk, untuk mendapatkan server.
Di balik arus gelap yang mengalir dalam rantai industri, perkembangan industri komputasi domestik juga menunjukkan arah baru.
01 Dari mana datangnya gelembung kecerdasan?
Pada akhir tahun 2023, "larangan Nvidia" dari seberang lautan bagaikan batu besar yang dilemparkan ke permukaan danau yang tenang, memicu perang gelap seputar sumber daya inti komputasi.
Pada beberapa bulan awal, pasar menunjukkan kekacauan dan gairah yang primitif. Di bawah godaan keuntungan besar, beberapa individu yang peka mulai mengambil risiko. "Pada saat itu, pasar dipenuhi dengan 'pemasok' dari berbagai latar belakang, ada pelajar yang baru pulang dari luar negeri, dan juga beberapa individu yang memiliki informasi baik," kenang seorang pelaku industri yang enggan disebutkan namanya, "Metode perputaran mereka relatif sederhana dan kasar, meskipun transaksi masih rahasia, tetapi belum membentuk rantai kompleks yang berlapis-lapis seperti yang terjadi kemudian."
Para "perintis" awal ini memanfaatkan perbedaan informasi dan berbagai saluran tidak resmi untuk mengalirkan kartu grafis high-end NVIDIA ke pasar. Akibatnya, harga kartu grafis secara alami melambung tinggi. Menurut beberapa laporan media, di antara mereka, beberapa pemasok individu bahkan menetapkan harga kartu grafis NVIDIA A100 hingga 128.000 yuan, jauh melebihi harga eceran yang disarankan resmi sekitar 10.000 dolar AS. Bahkan ada yang lebih ekstrem, seseorang di platform media sosial memegang chip H100, mengklaim bahwa harga per kepingnya mencapai 250.000 yuan. Pada saat itu, berbagai tindakan dan sikap di atas bisa dibilang hampir bersifat pamer.
Di bawah sirkulasi yang tersembunyi ini, beberapa penyedia daya komputasi besar telah mulai memiliki saluran jaringan perdagangan yang serupa, dan oleh karena itu, gelombang kecerdasan komputasi juga muncul pada periode yang sama. Antara 2022 hingga 2024, banyak tempat yang berlomba-lomba untuk membangun pusat kecerdasan komputasi. Data menunjukkan bahwa hanya pada tahun 2024, proyek pusat kecerdasan komputasi telah melebihi 458.
Namun, gelombang "perdagangan kartu dan kecerdasan komputasi" yang gegap gempita ini tidak bertahan lama. Pada akhir tahun 2024, terutama setelah model besar domestik seperti DeepSeek muncul dengan biaya yang sangat efisien, beberapa penyedia daya komputasi yang hanya bergantung pada "menimbun kartu" atau kurang didukung oleh teknologi inti menemukan bahwa cerita mereka semakin sulit untuk diceritakan. Gelembung kecerdasan komputasi juga mulai menunjukkan tanda-tanda pecah.
Menurut data statistik, pada kuartal pertama 2025, terdapat 165 proyek pusat kecerdasan di daratan China yang menunjukkan dinamika baru, di mana 58% (95 proyek) masih dalam status disetujui atau dalam tahap persiapan, sementara 33% (54 proyek) sedang dalam pembangunan atau segera akan mulai beroperasi, dan hanya ada 16 proyek yang benar-benar mulai beroperasi atau dalam fase percobaan, yang merupakan kurang dari 10%.
Tentu saja, tidak hanya di dalam negeri yang menunjukkan tanda-tanda pecahnya gelembung. Selama enam bulan terakhir, Meta, Microsoft, dan lainnya telah melaporkan penangguhan beberapa proyek pusat data global. Sisi lain dari gelembung adalah kekhawatiran akan ketidakefisienan dan kekosongan.
Seorang pelaku industri memberi tahu Huxiu, "Saat ini, tingkat penerangan pusat komputasi cerdas kurang dari 50%, chip lokal karena kekurangan kinerja, sama sekali tidak dapat digunakan untuk pelatihan awal. Selain itu, beberapa pusat komputasi cerdas menggunakan server yang relatif ketinggalan zaman."
Fenomena "kartu tidak bisa digunakan" ini diakui oleh para profesional industri sebagai "ketidaksesuaian struktural"—bukan karena kelebihan daya komputasi secara absolut, tetapi karena kekurangan pasokan daya komputasi yang efektif dan dapat memenuhi permintaan tinggi, sementara banyak sumber daya komputasi yang telah dibangun tidak dapat dimanfaatkan secara maksimal karena keterlambatan teknologi, ekosistem yang tidak sempurna, atau kemampuan operasional yang tidak memadai.
Namun, di tengah hiruk-pikuk dan kekhawatiran yang berdampingan dalam peta kecerdasan, para raksasa teknologi menunjukkan sikap yang sangat berbeda.
Menurut laporan, ByteDance berencana untuk menginvestasikan lebih dari US$12,3 miliar (sekitar 89,2 miliar yuan) dalam infrastruktur AI pada tahun 2025, di mana 40 miliar yuan dari anggaran akan digunakan untuk membeli chip AI di China, dan sekitar 50 miliar yuan lainnya direncanakan akan digunakan untuk membeli chip Nvidia. Dalam hal ini, Byte menanggapi Tiger Sniff bahwa berita tersebut tidak akurat.
Sama halnya dengan investasi besar dalam AI, Alibaba juga tidak ketinggalan. CEO Wu Yongming mengumumkan secara publik pada 24 Februari bahwa dalam tiga tahun ke depan, Alibaba berencana menginvestasikan 380 miliar yuan untuk membangun infrastruktur AI. Angka ini bahkan melebihi total investasi selama sepuluh tahun terakhir.
Namun, dengan pembelian dalam jumlah besar, tekanan di sisi pasokan juga semakin jelas. "Pasokan pasar tidak dapat memenuhi kebutuhan perusahaan besar, banyak perusahaan yang telah menandatangani kontrak tetapi tidak dapat mengirimkan barang." Seorang tenaga penjual dari pemasok kecerdasan buatan mengatakan kepada Tiger Sniff.
Sebagai perbandingan, gelembung kecerdasan yang disebutkan di atas tampaknya kontras dengan investasi besar-besaran perusahaan besar saat ini dalam infrastruktur AI: di satu sisi, penyedia daya komputasi yang dipimpin oleh pasar saham A menghentikan proyek kecerdasan besar, sementara di sisi lain perusahaan besar secara aktif berinvestasi dalam infrastruktur AI.
Dan alasan di balik ini tidak sulit dipahami. Karena titik waktu penurunan dramatis dalam komputasi cerdas kebetulan terjadi di sekitar DeepSeek. Mulai tahun ini, tidak ada lagi yang mengemukakan konsep terkait "perang seratus model", DeepSeek telah memecahkan gelembung permintaan pelatihan. Kini yang masih tersisa di meja adalah hanya perusahaan besar dan beberapa perusahaan model AI.
Menanggapi hal ini, Feng Bo, mitra pengelola Changlei Capital, juga mengatakan kepada Huxiu, "Ketika pelatihan tidak lagi beragam, orang-orang yang benar-benar memiliki kemampuan dan kualifikasi untuk melakukan pelatihan akan terus membeli kartu untuk pelatihan, seperti Alibaba dan ByteDance, sementara mereka yang tidak memiliki kemampuan untuk melakukan pelatihan akan pergi setelah pertunjukan berakhir, dan daya komputasi yang mereka miliki akan menjadi gelembung."
02 Daya komputasi yang dibatalkan sewa
Setiap "gelembung" yang lahir berakar pada imajinasi irasional manusia terhadap kelangkaan. Mereka yang memperdagangkan Maotai dan menimbun kekuatan komputasi bukanlah penggemar Maotai atau pihak yang mengonsumsi kekuatan komputasi, tetapi semuanya memiliki psikologi spekulatif yang sama.
Hingga akhir 2024 dan kuartal pertama 2025, beberapa perusahaan seperti Feilixin, Lianhua Holdings, dan Jinjis Co., Ltd. telah secara berturut-turut menghentikan kontrak sewa daya komputasi senilai ratusan juta yuan. Sementara itu, seorang penyedia daya komputasi mengatakan kepada Huxiu, "Dalam bisnis sewa daya komputasi, pengembalian sewa adalah hal yang biasa."
Perusahaan-perusahaan yang menghentikan sewa ini bukanlah terminal permintaan daya komputasi yang sebenarnya. Dengan guncangan industri yang dipicu oleh DeepSeek, gelembung industri AI perlahan-lahan pecah, banyak penyedia daya komputasi terpaksa menghadapi masalah kelebihan daya komputasi, mencari sumber pelanggan yang stabil, dan menjelajahi jalur baru untuk menyerap daya komputasi.
Huxiu menemukan dalam penyelidikannya bahwa di kartu nama seorang pendiri penyedia daya komputasi, selain tiga perusahaan di bidang komputasi cerdas dan komputasi awan, juga tercetak dengan jelas sebuah perusahaan investasi. Penyelidikan lebih lanjut mengungkapkan bahwa proyek-proyek yang diinvestasikan oleh perusahaan investasi tersebut mencakup sebuah perusahaan robotika dan sebuah perusahaan yang berfokus pada pengembangan model besar dan sistem awan. Pendiri tersebut mengungkapkan kepada Huxiu, "Semua kebutuhan daya komputasi dari kedua perusahaan yang diinvestasikan tersebut dipenuhi oleh sistem penyedia daya komputasi mereka sendiri; dan perusahaan yang diinvestasikan biasanya akan membeli daya komputasi yang mereka pasok dengan harga pasar yang rendah."
Sebenarnya, dalam industri komputasi cerdas, bentuk pengikatan investasi dengan komputasi cerdas+ bukanlah satu-satunya contoh. Bagi banyak penyedia daya komputasi, "ini adalah cara yang sangat baik untuk memanfaatkan kartu saat ini, hanya saja tidak ditampilkan secara terbuka." Feng Bo menyatakan kepada Huxiu.
Namun, dalam cerita di atas, ini adalah jalur pemanfaatan daya komputasi yang "monopoli", di mana penyedia daya komputasi mengunci permintaan daya komputasi melalui investasi dan secara langsung memenuhi semua kebutuhan daya komputasi dari proyek yang diinvestasikan. Tetapi bukan hanya cara ini.
Feng Bo percaya bahwa ada satu model lain, yaitu, "pemasok daya komputasi memasuki dana industri sebagai LP, membangun rantai permintaan daya komputasi yang tertutup layak diperhatikan."
Secara khusus, model bisnis ini menunjukkan karakteristik keterkaitan modal: Penyedia daya komputasi A sebagai calon mitra terbatas (LP), mencapai kesepakatan kerjasama dengan dana industri B. Dalam peta investasi dana B, perusahaan aplikasi AI C berfungsi sebagai perusahaan yang diinvestasikan, di mana pengembangan bisnisnya memiliki kebutuhan yang kaku terhadap sumber daya daya komputasi. Pada saat ini, A melalui investasi strategis di dana B, secara tidak langsung mengikat kebutuhan pengadaan daya komputasi perusahaan C di masa depan, membangun "investasi modal - pengadaan daya komputasi" sebagai siklus tertutup.
Jika transaksi berhasil, Perusahaan A akan mendapatkan hak layanan prioritas dengan status LP dan menjadi pemasok pilihan untuk pengadaan daya komputasi Perusahaan C. Model ini pada dasarnya membentuk aliran sirkulasi dana — investasi Perusahaan A ke dalam dana B akhirnya akan kembali melalui pengadaan daya komputasi Perusahaan C.
"Ini bukan cara yang mainstream, tetapi ini adalah cara yang masih cukup baik untuk digunakan." Feng Bo mengakui.
03 Gelembung hampir pecah, lalu apa?
"Membicarakan gelembung kecerdasan komputasi tidak bisa hanya berbicara tentang kekuatan komputasi, ini adalah masalah rantai industri. Untuk membuat kekuatan komputasi dapat digunakan, perlu menghubungkan titik-titik yang terputus. Saat ini, rantai industri ini belum membentuk siklus tertutup." Seorang kepala pemasaran dari penyedia kekuatan komputasi yang telah berkecimpung di industri selama bertahun-tahun dengan tepat menunjukkan inti permasalahan dalam industri kecerdasan komputasi saat ini.
Memasuki paruh pertama tahun 2025, salah satu tren yang mencolok di bidang AI adalah bahwa istilah "pra-pelatihan" yang sebelumnya sering diucapkan oleh berbagai perusahaan AI, kini panasnya secara bertahap digantikan oleh "penalaran". Baik untuk pasar konsumen C-end yang luas maupun aplikasi tingkat perusahaan B-end yang memberdayakan berbagai industri, kurva pertumbuhan permintaan penalaran tampak sangat curam.
"Mari kita lakukan sebuah proyeksi sederhana," kata seorang analis industri. "Dengan menghitung ukuran aplikasi AI utama di pasar saat ini, seperti Doubao, DeepSeek, dan lain-lain, misalkan setiap pengguna aktif menghasilkan rata-rata 10 gambar per hari, maka kebutuhan daya komputasi yang ditarik di balik ini dapat dengan mudah mencapai tingkat juta P. Ini hanya untuk satu skenario pembuatan gambar; jika ditambahkan interaksi multimodal seperti teks, suara, dan video, maka tingkat kebutuhannya bahkan lebih sulit untuk diperkirakan."
Ini hanya kebutuhan inferensi pengguna C-end. Untuk pengguna B-end, persyaratan inferensi bahkan lebih besar. Seorang eksekutif senior Sinovel Intelligent Computing mengatakan kepada Tiger Sniff bahwa pembangunan pusat komputasi cerdas oleh pabrik mobil dimulai dengan skala 10.000 P, "dan di antara pelanggan kami, selain produsen besar, pabrik mobil memiliki kebutuhan daya komputasi paling banyak." ”
Namun, ketika mengaitkan permintaan inferensi yang besar dengan gelembung daya komputasi, cerita ini terlihat sangat konyol. Mengapa begitu banyak permintaan inferensi masih menghasilkan gelembung daya komputasi?
Seorang pemasok daya komputasi mengatakan kepada Tiger Sniff bahwa persyaratan inferensi besar-besaran seperti itu membutuhkan penyedia layanan komputasi cerdas untuk mengoptimalkan daya komputasi melalui teknologi rekayasa, seperti mengompresi waktu mulai, meningkatkan jumlah penyimpanan, mempersingkat penundaan inferensi, dan meningkatkan throughput dan akurasi inferensi.
Tidak hanya itu, masalah ketidaksesuaian penawaran dan permintaan yang disebutkan di atas juga sebagian besar berasal dari masalah chip. Terkait hal ini, beberapa sumber industri yang mengetahui hal tersebut menyampaikan kepada Huxiu bahwa perbedaan antara beberapa kartu dalam negeri dan Nvidia masih cukup besar, perkembangan kinerja mereka sendiri tidak merata, bahkan jika satu merek menumpuk banyak kekurangan kartu, masalah tersebut tetap ada. Hal ini menyebabkan satu kluster tunggal tidak dapat menyelesaikan pelatihan dan inferensi AI secara efektif.
Efek ‘keterbatasan’ ini berarti bahwa meskipun membangun kluster kekuatan komputasi dengan menumpuk chip secara besar-besaran, jika masalah keterbatasan tidak dapat diatasi dengan efektif, maka kinerja keseluruhan dari kluster tersebut tetap akan terbatasi, dan sulit untuk mendukung pelatihan kompleks dari model AI besar dan tugas inferensi berskala besar secara efisien.
Sebenarnya, tantangan rekayasa di tingkat daya komputasi dan kendala chip memang sangat serius, tetapi banyak kebutuhan daya komputasi yang mendalam belum terpenuhi dengan efektif, dan "titik putus" yang sebenarnya sering muncul di ekosistem aplikasi di atas lapisan daya komputasi, terutama kekurangan yang serius dari model vertikal di lapisan L2 (yaitu, untuk industri atau skenario tertentu).
Di industri medis ada "lubang" besar yang perlu diisi, efek penghisapan talenta adalah masalah struktural yang lama dikeluhkan dalam sistem medis domestik, di mana dokter-dokter unggul terkonsentrasi di rumah sakit kelas satu di kota-kota besar. Namun, ketika industri berharap pada model besar medis untuk mendistribusikan sumber daya medis berkualitas, tantangan yang lebih mendasar muncul: bagaimana membangun ruang data medis yang dapat dipercaya?
Karena ingin melatih model besar khusus yang memiliki kemampuan diagnosis dan pengobatan sepanjang perjalanan penyakit, data adalah prasyarat kunci. Namun masalahnya, harus ada data besar yang mencakup seluruh perjalanan penyakit, semua kelompok usia, semua jenis kelamin, dan semua wilayah untuk membentuk pengetahuan dalam model besar. Dan kenyataannya adalah tingkat keterbukaan data medis kurang dari 5%.
Seorang kepala departemen informasi di rumah sakit kelas A mengungkapkan bahwa dari 500TB data perawatan yang dihasilkan rumah sakitnya setiap tahun, kurang dari 3% adalah data terstruktur yang telah dihilangkan sensitivitasnya dan dapat digunakan untuk pelatihan AI. Lebih parah lagi, data penyakit langka dan penyakit kronis yang menyumbang 80% nilai peta penyakit, karena sensitivitasnya, telah lama terperangkap di "pulau data" di berbagai lembaga medis.
Dan titik-titik putus seperti ini tidak dapat diselesaikan, rantai industri tidak dapat membentuk siklus tertutup. Permintaan daya komputasi secara alami tidak dapat dipenuhi, jelas, ini jelas sudah jauh melampaui cakupan yang dapat ditangani secara independen oleh penyedia infrastruktur daya komputasi tradisional yang hanya menyediakan "kartu dan listrik".
Namun, saat ini sudah ada sekelompok penyedia layanan komputasi cerdas baru yang secara diam-diam muncul. Perusahaan-perusahaan ini tidak lagi membatasi diri mereka pada penyediaan perangkat keras semata atau penyewaan daya komputasi, mereka juga dapat membentuk tim algoritma profesional dan tim ahli industri, serta terlibat secara mendalam dalam pengembangan dan optimasi aplikasi AI pelanggan.
Sementara itu, menghadapi berbagai masalah seperti ketidaksesuaian sumber daya dan tingkat pemanfaatan daya komputasi, berbagai daerah sebenarnya juga telah mengeluarkan berbagai kebijakan subsidi daya komputasi berdasarkan kebutuhan industri lokal, di mana "kupon daya komputasi" berfungsi sebagai cara subsidi yang secara langsung mengurangi biaya penggunaan daya komputasi oleh perusahaan. Hanya saja, bagi industri kecerdasan komputasi China saat ini, obat "darurat" kebijakan semata mungkin sudah sulit untuk mengubah situasi secara mendasar.
Saat ini, yang dibutuhkan oleh industri kecerdasan adalah ekosistem "darah buatan".
Konten ini hanya untuk referensi, bukan ajakan atau tawaran. Tidak ada nasihat investasi, pajak, atau hukum yang diberikan. Lihat Penafian untuk pengungkapan risiko lebih lanjut.
Sebuah gelembung besar yang dipicu oleh Nvidia hampir pecah.
Sumber: AGI antarmuka
Pada pertengahan Mei, periode jendela 90 hari penangguhan tarif, sebuah pertempuran untuk sumber daya inti daya komputasi tiba-tiba memanas.
"Harga server berfluktuasi dengan tajam, beberapa waktu lalu harga per unit telah meningkat 15%-20%. Dengan penangguhan tarif, kami berencana untuk menjual kembali dengan harga asli." Sebuah pemasok chip di daerah selatan mengungkapkan kepada Huxiu.
Sementara itu, sisi pasokan pasar juga menghadapi variabel baru. Tiger Sniff mendapatkan informasi eksklusif bahwa produk high-end seri Hooper dari Nvidia dan seri Blackwell telah diam-diam muncul di pasar domestik, di mana kemunculan yang pertama terjadi sekitar September 2024, sedangkan yang kedua baru saja terjadi. Eksekutif terkait dari Huari Zhikuan menyatakan, "saluran pengadaan sumber dari berbagai pemasok sangat bervariasi." Namun, jaringan rantai pasokan yang kompleks di balik ini sulit untuk dijelajahi.
(Catatan Huxiu: Mulai 17 Oktober 2023, pihak Washington secara bertahap menghentikan penjualan chip Nvidia ke China, termasuk A100, A800, H800, H100, H200; baru-baru ini, H20 dari seri Hooper yang terakhir dapat dijual ke China juga dimasukkan dalam daftar larangan ekspor.)
Di antaranya, seri premium Hooper dari NVIDIA biasanya merujuk pada H200, yang merupakan versi upgrade dari chip H100, yang harganya hanya lebih tinggi sekitar dua ratus ribu, tetapi efisiensinya lebih tinggi 30%. Sementara itu, seri Blackwell termasuk dalam seri premium NVIDIA, di mana B200 harganya mencapai lebih dari tiga juta, juga merupakan produk dengan "peredaran yang paling terbatas" saat ini, dengan jalur peredarannya yang lebih rahasia. Kedua model ini digunakan untuk pelatihan model besar, dan B200 bahkan "sulit didapat".
Melihat kembali ke garis waktu, pada bulan April 2024, sebuah foto bersama Huang Renxun dengan Ultraman (Sam Altman) dan co-founder OpenAI Greg Brockman beredar di Twitter. Di balik foto ini adalah titik pengiriman kunci untuk produk pertama H200 - CEO Nvidia Huang Renxun secara pribadi mengantarkan barang tersebut, dan OpenAI adalah pengguna pertama H200.
Dalam waktu singkat 5 bulan, berita tentang pasokan H200 datang dari seberang lautan. Saat ini, sudah ada pemasok di dalam negeri yang memiliki kapasitas pasokan 100 unit server H200 per minggu. Menurut pemasok tersebut, dengan dihentikannya produksi H100, permintaan pasar sedang beralih dengan cepat ke H200, dan saat ini pemasok yang menguasai pasokan H200 tidak lebih dari sepuluh, sehingga kesenjangan antara penawaran dan permintaan semakin melebar.
"Saat ini yang paling dibutuhkan di pasar adalah H200, dan menurut pengetahuan saya, ada sebuah perusahaan cloud yang baru-baru ini sedang mencari H200 di mana-mana." Seorang pemain berpengalaman di industri komputasi selama 18 tahun memberi tahu Huxiu, mereka telah lama menyediakan layanan komputasi untuk Baidu, Alibaba, Tencent, dan Byte.
Dalam perlombaan arms race daya komputasi ini, rantai transaksi diselimuti misteri. Salah satu penyedia daya komputasi terkemuka di dalam negeri menyatakan bahwa aturan penilaian daya komputasi yang berlaku di industri adalah bahwa dalam kontrak hanya dicantumkan unit daya komputasi "P", yang mengubah transaksi server menjadi transaksi daya komputasi yang abstrak. (Catatan: P adalah satuan pengukuran daya komputasi) Misalnya, ketika pihak pengguna daya komputasi melakukan transaksi dengan penyedia daya komputasi, mereka tidak akan langsung mencantumkan model kartu dalam kontrak, melainkan menggantinya dengan jumlah daya komputasi dalam P, yang berarti bahwa secara terbuka tidak akan mencantumkan model kartu tertentu.
Mendalami dasar rantai industri, jaringan perdagangan yang tersembunyi muncul ke permukaan. Sebelumnya, beberapa media mengungkapkan bahwa beberapa distributor di China melalui saluran pengadaan khusus, dengan banyak lapisan penjualan kembali dan pengemasan, mewujudkan "penawaran melingkar" server. Dan Tiger Sniff lebih lanjut memahami bahwa ada beberapa distributor yang mencari jalan lain, memanfaatkan perusahaan pihak ketiga, dengan cara menyisipkan modul ke dalam produk, untuk mendapatkan server.
Di balik arus gelap yang mengalir dalam rantai industri, perkembangan industri komputasi domestik juga menunjukkan arah baru.
01 Dari mana datangnya gelembung kecerdasan?
Pada akhir tahun 2023, "larangan Nvidia" dari seberang lautan bagaikan batu besar yang dilemparkan ke permukaan danau yang tenang, memicu perang gelap seputar sumber daya inti komputasi.
Pada beberapa bulan awal, pasar menunjukkan kekacauan dan gairah yang primitif. Di bawah godaan keuntungan besar, beberapa individu yang peka mulai mengambil risiko. "Pada saat itu, pasar dipenuhi dengan 'pemasok' dari berbagai latar belakang, ada pelajar yang baru pulang dari luar negeri, dan juga beberapa individu yang memiliki informasi baik," kenang seorang pelaku industri yang enggan disebutkan namanya, "Metode perputaran mereka relatif sederhana dan kasar, meskipun transaksi masih rahasia, tetapi belum membentuk rantai kompleks yang berlapis-lapis seperti yang terjadi kemudian."
Para "perintis" awal ini memanfaatkan perbedaan informasi dan berbagai saluran tidak resmi untuk mengalirkan kartu grafis high-end NVIDIA ke pasar. Akibatnya, harga kartu grafis secara alami melambung tinggi. Menurut beberapa laporan media, di antara mereka, beberapa pemasok individu bahkan menetapkan harga kartu grafis NVIDIA A100 hingga 128.000 yuan, jauh melebihi harga eceran yang disarankan resmi sekitar 10.000 dolar AS. Bahkan ada yang lebih ekstrem, seseorang di platform media sosial memegang chip H100, mengklaim bahwa harga per kepingnya mencapai 250.000 yuan. Pada saat itu, berbagai tindakan dan sikap di atas bisa dibilang hampir bersifat pamer.
Di bawah sirkulasi yang tersembunyi ini, beberapa penyedia daya komputasi besar telah mulai memiliki saluran jaringan perdagangan yang serupa, dan oleh karena itu, gelombang kecerdasan komputasi juga muncul pada periode yang sama. Antara 2022 hingga 2024, banyak tempat yang berlomba-lomba untuk membangun pusat kecerdasan komputasi. Data menunjukkan bahwa hanya pada tahun 2024, proyek pusat kecerdasan komputasi telah melebihi 458.
Namun, gelombang "perdagangan kartu dan kecerdasan komputasi" yang gegap gempita ini tidak bertahan lama. Pada akhir tahun 2024, terutama setelah model besar domestik seperti DeepSeek muncul dengan biaya yang sangat efisien, beberapa penyedia daya komputasi yang hanya bergantung pada "menimbun kartu" atau kurang didukung oleh teknologi inti menemukan bahwa cerita mereka semakin sulit untuk diceritakan. Gelembung kecerdasan komputasi juga mulai menunjukkan tanda-tanda pecah.
Menurut data statistik, pada kuartal pertama 2025, terdapat 165 proyek pusat kecerdasan di daratan China yang menunjukkan dinamika baru, di mana 58% (95 proyek) masih dalam status disetujui atau dalam tahap persiapan, sementara 33% (54 proyek) sedang dalam pembangunan atau segera akan mulai beroperasi, dan hanya ada 16 proyek yang benar-benar mulai beroperasi atau dalam fase percobaan, yang merupakan kurang dari 10%.
Tentu saja, tidak hanya di dalam negeri yang menunjukkan tanda-tanda pecahnya gelembung. Selama enam bulan terakhir, Meta, Microsoft, dan lainnya telah melaporkan penangguhan beberapa proyek pusat data global. Sisi lain dari gelembung adalah kekhawatiran akan ketidakefisienan dan kekosongan.
Seorang pelaku industri memberi tahu Huxiu, "Saat ini, tingkat penerangan pusat komputasi cerdas kurang dari 50%, chip lokal karena kekurangan kinerja, sama sekali tidak dapat digunakan untuk pelatihan awal. Selain itu, beberapa pusat komputasi cerdas menggunakan server yang relatif ketinggalan zaman."
Fenomena "kartu tidak bisa digunakan" ini diakui oleh para profesional industri sebagai "ketidaksesuaian struktural"—bukan karena kelebihan daya komputasi secara absolut, tetapi karena kekurangan pasokan daya komputasi yang efektif dan dapat memenuhi permintaan tinggi, sementara banyak sumber daya komputasi yang telah dibangun tidak dapat dimanfaatkan secara maksimal karena keterlambatan teknologi, ekosistem yang tidak sempurna, atau kemampuan operasional yang tidak memadai.
Namun, di tengah hiruk-pikuk dan kekhawatiran yang berdampingan dalam peta kecerdasan, para raksasa teknologi menunjukkan sikap yang sangat berbeda.
Menurut laporan, ByteDance berencana untuk menginvestasikan lebih dari US$12,3 miliar (sekitar 89,2 miliar yuan) dalam infrastruktur AI pada tahun 2025, di mana 40 miliar yuan dari anggaran akan digunakan untuk membeli chip AI di China, dan sekitar 50 miliar yuan lainnya direncanakan akan digunakan untuk membeli chip Nvidia. Dalam hal ini, Byte menanggapi Tiger Sniff bahwa berita tersebut tidak akurat.
Sama halnya dengan investasi besar dalam AI, Alibaba juga tidak ketinggalan. CEO Wu Yongming mengumumkan secara publik pada 24 Februari bahwa dalam tiga tahun ke depan, Alibaba berencana menginvestasikan 380 miliar yuan untuk membangun infrastruktur AI. Angka ini bahkan melebihi total investasi selama sepuluh tahun terakhir.
Namun, dengan pembelian dalam jumlah besar, tekanan di sisi pasokan juga semakin jelas. "Pasokan pasar tidak dapat memenuhi kebutuhan perusahaan besar, banyak perusahaan yang telah menandatangani kontrak tetapi tidak dapat mengirimkan barang." Seorang tenaga penjual dari pemasok kecerdasan buatan mengatakan kepada Tiger Sniff.
Sebagai perbandingan, gelembung kecerdasan yang disebutkan di atas tampaknya kontras dengan investasi besar-besaran perusahaan besar saat ini dalam infrastruktur AI: di satu sisi, penyedia daya komputasi yang dipimpin oleh pasar saham A menghentikan proyek kecerdasan besar, sementara di sisi lain perusahaan besar secara aktif berinvestasi dalam infrastruktur AI.
Dan alasan di balik ini tidak sulit dipahami. Karena titik waktu penurunan dramatis dalam komputasi cerdas kebetulan terjadi di sekitar DeepSeek. Mulai tahun ini, tidak ada lagi yang mengemukakan konsep terkait "perang seratus model", DeepSeek telah memecahkan gelembung permintaan pelatihan. Kini yang masih tersisa di meja adalah hanya perusahaan besar dan beberapa perusahaan model AI.
Menanggapi hal ini, Feng Bo, mitra pengelola Changlei Capital, juga mengatakan kepada Huxiu, "Ketika pelatihan tidak lagi beragam, orang-orang yang benar-benar memiliki kemampuan dan kualifikasi untuk melakukan pelatihan akan terus membeli kartu untuk pelatihan, seperti Alibaba dan ByteDance, sementara mereka yang tidak memiliki kemampuan untuk melakukan pelatihan akan pergi setelah pertunjukan berakhir, dan daya komputasi yang mereka miliki akan menjadi gelembung."
02 Daya komputasi yang dibatalkan sewa
Setiap "gelembung" yang lahir berakar pada imajinasi irasional manusia terhadap kelangkaan. Mereka yang memperdagangkan Maotai dan menimbun kekuatan komputasi bukanlah penggemar Maotai atau pihak yang mengonsumsi kekuatan komputasi, tetapi semuanya memiliki psikologi spekulatif yang sama.
Hingga akhir 2024 dan kuartal pertama 2025, beberapa perusahaan seperti Feilixin, Lianhua Holdings, dan Jinjis Co., Ltd. telah secara berturut-turut menghentikan kontrak sewa daya komputasi senilai ratusan juta yuan. Sementara itu, seorang penyedia daya komputasi mengatakan kepada Huxiu, "Dalam bisnis sewa daya komputasi, pengembalian sewa adalah hal yang biasa."
Perusahaan-perusahaan yang menghentikan sewa ini bukanlah terminal permintaan daya komputasi yang sebenarnya. Dengan guncangan industri yang dipicu oleh DeepSeek, gelembung industri AI perlahan-lahan pecah, banyak penyedia daya komputasi terpaksa menghadapi masalah kelebihan daya komputasi, mencari sumber pelanggan yang stabil, dan menjelajahi jalur baru untuk menyerap daya komputasi.
Huxiu menemukan dalam penyelidikannya bahwa di kartu nama seorang pendiri penyedia daya komputasi, selain tiga perusahaan di bidang komputasi cerdas dan komputasi awan, juga tercetak dengan jelas sebuah perusahaan investasi. Penyelidikan lebih lanjut mengungkapkan bahwa proyek-proyek yang diinvestasikan oleh perusahaan investasi tersebut mencakup sebuah perusahaan robotika dan sebuah perusahaan yang berfokus pada pengembangan model besar dan sistem awan. Pendiri tersebut mengungkapkan kepada Huxiu, "Semua kebutuhan daya komputasi dari kedua perusahaan yang diinvestasikan tersebut dipenuhi oleh sistem penyedia daya komputasi mereka sendiri; dan perusahaan yang diinvestasikan biasanya akan membeli daya komputasi yang mereka pasok dengan harga pasar yang rendah."
Sebenarnya, dalam industri komputasi cerdas, bentuk pengikatan investasi dengan komputasi cerdas+ bukanlah satu-satunya contoh. Bagi banyak penyedia daya komputasi, "ini adalah cara yang sangat baik untuk memanfaatkan kartu saat ini, hanya saja tidak ditampilkan secara terbuka." Feng Bo menyatakan kepada Huxiu.
Namun, dalam cerita di atas, ini adalah jalur pemanfaatan daya komputasi yang "monopoli", di mana penyedia daya komputasi mengunci permintaan daya komputasi melalui investasi dan secara langsung memenuhi semua kebutuhan daya komputasi dari proyek yang diinvestasikan. Tetapi bukan hanya cara ini.
Feng Bo percaya bahwa ada satu model lain, yaitu, "pemasok daya komputasi memasuki dana industri sebagai LP, membangun rantai permintaan daya komputasi yang tertutup layak diperhatikan."
Secara khusus, model bisnis ini menunjukkan karakteristik keterkaitan modal: Penyedia daya komputasi A sebagai calon mitra terbatas (LP), mencapai kesepakatan kerjasama dengan dana industri B. Dalam peta investasi dana B, perusahaan aplikasi AI C berfungsi sebagai perusahaan yang diinvestasikan, di mana pengembangan bisnisnya memiliki kebutuhan yang kaku terhadap sumber daya daya komputasi. Pada saat ini, A melalui investasi strategis di dana B, secara tidak langsung mengikat kebutuhan pengadaan daya komputasi perusahaan C di masa depan, membangun "investasi modal - pengadaan daya komputasi" sebagai siklus tertutup.
Jika transaksi berhasil, Perusahaan A akan mendapatkan hak layanan prioritas dengan status LP dan menjadi pemasok pilihan untuk pengadaan daya komputasi Perusahaan C. Model ini pada dasarnya membentuk aliran sirkulasi dana — investasi Perusahaan A ke dalam dana B akhirnya akan kembali melalui pengadaan daya komputasi Perusahaan C.
"Ini bukan cara yang mainstream, tetapi ini adalah cara yang masih cukup baik untuk digunakan." Feng Bo mengakui.
03 Gelembung hampir pecah, lalu apa?
"Membicarakan gelembung kecerdasan komputasi tidak bisa hanya berbicara tentang kekuatan komputasi, ini adalah masalah rantai industri. Untuk membuat kekuatan komputasi dapat digunakan, perlu menghubungkan titik-titik yang terputus. Saat ini, rantai industri ini belum membentuk siklus tertutup." Seorang kepala pemasaran dari penyedia kekuatan komputasi yang telah berkecimpung di industri selama bertahun-tahun dengan tepat menunjukkan inti permasalahan dalam industri kecerdasan komputasi saat ini.
Memasuki paruh pertama tahun 2025, salah satu tren yang mencolok di bidang AI adalah bahwa istilah "pra-pelatihan" yang sebelumnya sering diucapkan oleh berbagai perusahaan AI, kini panasnya secara bertahap digantikan oleh "penalaran". Baik untuk pasar konsumen C-end yang luas maupun aplikasi tingkat perusahaan B-end yang memberdayakan berbagai industri, kurva pertumbuhan permintaan penalaran tampak sangat curam.
"Mari kita lakukan sebuah proyeksi sederhana," kata seorang analis industri. "Dengan menghitung ukuran aplikasi AI utama di pasar saat ini, seperti Doubao, DeepSeek, dan lain-lain, misalkan setiap pengguna aktif menghasilkan rata-rata 10 gambar per hari, maka kebutuhan daya komputasi yang ditarik di balik ini dapat dengan mudah mencapai tingkat juta P. Ini hanya untuk satu skenario pembuatan gambar; jika ditambahkan interaksi multimodal seperti teks, suara, dan video, maka tingkat kebutuhannya bahkan lebih sulit untuk diperkirakan."
Ini hanya kebutuhan inferensi pengguna C-end. Untuk pengguna B-end, persyaratan inferensi bahkan lebih besar. Seorang eksekutif senior Sinovel Intelligent Computing mengatakan kepada Tiger Sniff bahwa pembangunan pusat komputasi cerdas oleh pabrik mobil dimulai dengan skala 10.000 P, "dan di antara pelanggan kami, selain produsen besar, pabrik mobil memiliki kebutuhan daya komputasi paling banyak." ”
Namun, ketika mengaitkan permintaan inferensi yang besar dengan gelembung daya komputasi, cerita ini terlihat sangat konyol. Mengapa begitu banyak permintaan inferensi masih menghasilkan gelembung daya komputasi?
Seorang pemasok daya komputasi mengatakan kepada Tiger Sniff bahwa persyaratan inferensi besar-besaran seperti itu membutuhkan penyedia layanan komputasi cerdas untuk mengoptimalkan daya komputasi melalui teknologi rekayasa, seperti mengompresi waktu mulai, meningkatkan jumlah penyimpanan, mempersingkat penundaan inferensi, dan meningkatkan throughput dan akurasi inferensi.
Tidak hanya itu, masalah ketidaksesuaian penawaran dan permintaan yang disebutkan di atas juga sebagian besar berasal dari masalah chip. Terkait hal ini, beberapa sumber industri yang mengetahui hal tersebut menyampaikan kepada Huxiu bahwa perbedaan antara beberapa kartu dalam negeri dan Nvidia masih cukup besar, perkembangan kinerja mereka sendiri tidak merata, bahkan jika satu merek menumpuk banyak kekurangan kartu, masalah tersebut tetap ada. Hal ini menyebabkan satu kluster tunggal tidak dapat menyelesaikan pelatihan dan inferensi AI secara efektif.
Efek ‘keterbatasan’ ini berarti bahwa meskipun membangun kluster kekuatan komputasi dengan menumpuk chip secara besar-besaran, jika masalah keterbatasan tidak dapat diatasi dengan efektif, maka kinerja keseluruhan dari kluster tersebut tetap akan terbatasi, dan sulit untuk mendukung pelatihan kompleks dari model AI besar dan tugas inferensi berskala besar secara efisien.
Sebenarnya, tantangan rekayasa di tingkat daya komputasi dan kendala chip memang sangat serius, tetapi banyak kebutuhan daya komputasi yang mendalam belum terpenuhi dengan efektif, dan "titik putus" yang sebenarnya sering muncul di ekosistem aplikasi di atas lapisan daya komputasi, terutama kekurangan yang serius dari model vertikal di lapisan L2 (yaitu, untuk industri atau skenario tertentu).
Di industri medis ada "lubang" besar yang perlu diisi, efek penghisapan talenta adalah masalah struktural yang lama dikeluhkan dalam sistem medis domestik, di mana dokter-dokter unggul terkonsentrasi di rumah sakit kelas satu di kota-kota besar. Namun, ketika industri berharap pada model besar medis untuk mendistribusikan sumber daya medis berkualitas, tantangan yang lebih mendasar muncul: bagaimana membangun ruang data medis yang dapat dipercaya?
Karena ingin melatih model besar khusus yang memiliki kemampuan diagnosis dan pengobatan sepanjang perjalanan penyakit, data adalah prasyarat kunci. Namun masalahnya, harus ada data besar yang mencakup seluruh perjalanan penyakit, semua kelompok usia, semua jenis kelamin, dan semua wilayah untuk membentuk pengetahuan dalam model besar. Dan kenyataannya adalah tingkat keterbukaan data medis kurang dari 5%.
Seorang kepala departemen informasi di rumah sakit kelas A mengungkapkan bahwa dari 500TB data perawatan yang dihasilkan rumah sakitnya setiap tahun, kurang dari 3% adalah data terstruktur yang telah dihilangkan sensitivitasnya dan dapat digunakan untuk pelatihan AI. Lebih parah lagi, data penyakit langka dan penyakit kronis yang menyumbang 80% nilai peta penyakit, karena sensitivitasnya, telah lama terperangkap di "pulau data" di berbagai lembaga medis.
Dan titik-titik putus seperti ini tidak dapat diselesaikan, rantai industri tidak dapat membentuk siklus tertutup. Permintaan daya komputasi secara alami tidak dapat dipenuhi, jelas, ini jelas sudah jauh melampaui cakupan yang dapat ditangani secara independen oleh penyedia infrastruktur daya komputasi tradisional yang hanya menyediakan "kartu dan listrik".
Namun, saat ini sudah ada sekelompok penyedia layanan komputasi cerdas baru yang secara diam-diam muncul. Perusahaan-perusahaan ini tidak lagi membatasi diri mereka pada penyediaan perangkat keras semata atau penyewaan daya komputasi, mereka juga dapat membentuk tim algoritma profesional dan tim ahli industri, serta terlibat secara mendalam dalam pengembangan dan optimasi aplikasi AI pelanggan.
Sementara itu, menghadapi berbagai masalah seperti ketidaksesuaian sumber daya dan tingkat pemanfaatan daya komputasi, berbagai daerah sebenarnya juga telah mengeluarkan berbagai kebijakan subsidi daya komputasi berdasarkan kebutuhan industri lokal, di mana "kupon daya komputasi" berfungsi sebagai cara subsidi yang secara langsung mengurangi biaya penggunaan daya komputasi oleh perusahaan. Hanya saja, bagi industri kecerdasan komputasi China saat ini, obat "darurat" kebijakan semata mungkin sudah sulit untuk mengubah situasi secara mendasar.
Saat ini, yang dibutuhkan oleh industri kecerdasan adalah ekosistem "darah buatan".