Dasar
Spot
Perdagangkan kripto dengan bebas
Perdagangan Margin
Perbesar keuntungan Anda dengan leverage
Konversi & Investasi Otomatis
0 Fees
Perdagangkan dalam ukuran berapa pun tanpa biaya dan tanpa slippage
ETF
Dapatkan eksposur ke posisi leverage dengan mudah
Perdagangan Pre-Market
Perdagangkan token baru sebelum listing
Futures
Akses ribuan kontrak perpetual
CFD
Emas
Satu platform aset tradisional global
Opsi
Hot
Perdagangkan Opsi Vanilla ala Eropa
Akun Terpadu
Memaksimalkan efisiensi modal Anda
Perdagangan Demo
Pengantar tentang Perdagangan Futures
Bersiap untuk perdagangan futures Anda
Acara Futures
Gabung acara & dapatkan hadiah
Perdagangan Demo
Gunakan dana virtual untuk merasakan perdagangan bebas risiko
CFD
Derivatif CFD Saham AS
Saham AS
Akses saham AS dan ETF yang nyata
Saham HK
Perdagangkan saham berkualitas yang terdaftar di Hong Kong
Saham Korea
SK Hynix
Perdagangkan Saham Korea Nyata dan Berinvestasi pada Aset Populer
Saham Futures
Leverage tinggi, perdagangan 24/7
Tokenized Stocks
Didukung oleh aset saham nyata
IPO Access
Buka akses penuh ke IPO saham global
GUSD
Mint GUSD untuk Imbal Hasil Treasury RWA
Aktivitas Saham
Perdagangkan Saham Populer dan Dapatkan Airdrop yang Melimpah
Peluncuran
CandyDrop
Koleksi permen untuk mendapatkan airdrop
Launchpool
Staking cepat, dapatkan token baru yang potensial
HODLer Airdrop
Pegang GT dan dapatkan airdrop besar secara gratis
IPO Access
Buka akses penuh ke IPO saham global
Poin Alpha
Perdagangkan aset on-chain, raih airdrop
Poin Futures
Dapatkan poin futures dan klaim hadiah airdrop
Investasi
Simple Earn
Dapatkan bunga dengan token yang menganggur
Investasi Otomatis
Investasi otomatis secara teratur
Investasi Ganda
Keuntungan dari volatilitas pasar
Soft Staking
Dapatkan hadiah dengan staking fleksibel
Pinjaman Kripto
0 Fees
Menjaminkan satu kripto untuk meminjam kripto lainnya
Pusat Peminjaman
Hub Peminjaman Terpadu
Promosi
AI
Gate AI
Partner AI serbaguna untuk Anda
Gate AI Bot
Gunakan Gate AI langsung di aplikasi sosial Anda
GateClaw
Gate Blue Lobster, langsung pakai
Gate for AI Agent
Infrastruktur AI, Gate MCP, Skills, dan CLI
Gate Skills Hub
10RB+ Skills
Dari kantor hingga trading, satu platform keterampilan membuat AI jadi lebih mudah digunakan
Dari Infrastruktur Listrik hingga Ekonomi Token: "Kue Tujuh Lapisan" dari Rantai Industri AI
Judul asli: Dari Infrastruktur Listrik hingga Ekonomi Token: "Kue Tujuh Lapisan" Rantai Industri AI
Penulis asli:律动BlockBeats
Sumber asli:
Repost: Huoxing Caijing
Daya penggerak era AI, telah beralih dari model menjadi Token
Dalam dua tahun terakhir, logika narasi utama di industri AI berfokus pada "Perang Model Besar" yang dimulai oleh berbagai perusahaan besar. Jumlah parameter dari ratusan miliar meningkat menjadi triliunan, biaya pelatihan dari puluhan juta dolar meningkat menjadi ratusan juta dolar, klaster GPU dari beberapa ribu kartu berkembang menjadi puluhan ribu kartu. Semua orang membahas siapa model yang lebih kuat, siapa yang lebih dekat dengan AGI, seolah-olah titik akhir kompetisi AI adalah performa model besar itu sendiri.
Namun, pada tahun 2026, logika penggerak industri AI telah berubah. Laporan terbaru JPMorgan menyatakan bahwa yang benar-benar mendorong ekspansi infrastruktur AI di masa depan bukan lagi pelatihan model, melainkan permintaan inferensi AI yang masif. Di masa depan, konsumsi daya komputasi terbanyak tidak lagi hanya untuk melatih model besar, tetapi untuk Agen AI yang tersebar di seluruh dunia. Setiap panggilan, setiap interaksi, setiap eksekusi tugas, pada dasarnya menghabiskan Token. Industri AI sedang beralih dari "Era Model" ke "Era Industri Token".
Karena yang benar-benar menggerakkan dunia AI di masa depan bukan lagi model itu sendiri, tetapi sistem produksi, distribusi, penjadwalan, dan konsumsi yang terbentuk di sekitar Token. Terutama setelah munculnya Agen AI dalam skala besar, bagaimana Token dihasilkan secara real-time, didistribusikan lintas wilayah, dijadwalkan secara dinamis, dan dikonsumsi secara efisien akan menjadi masalah utama baru dalam industri AI.
Seperti yang baru-baru ini diajukan oleh Huang Renxun, AI bukan sekadar industri perangkat lunak sederhana, melainkan sebuah sistem infrastruktur dasar seperti listrik dan internet. Dalam kerangka "Lima Lapisan Kue"-nya, industri AI dibagi menjadi lima lapisan: Energi, Chip, Infrastruktur, Model, dan Aplikasi. Seiring industri AI secara bertahap beralih dari "Era Pelatihan" ke "Era Inferensi", GoodVision AI lebih cenderung memandang seluruh rantai ekonomi AI sebagai "Kue Tujuh Lapisan" yang beroperasi di sekitar Token:
Lapisan pertama: Listrik — Dasar energi di era AI Lapisan kedua: AIDC — Pabrik Token Lapisan ketiga: GPU — Perangkat produksi Token Lapisan keempat: LLM — Mesin produksi Token Lapisan kelima: Distribusi Token — "Jaringan listrik" di era AI Lapisan keenam: Optimisasi Token dan Penjadwalan Cerdas — Otak di era AI Lapisan ketujuh: Agen AI — Terminal konsumsi Token
Dari energi, GPU, hingga AIDC, node edge, hingga inferensi model dan penjadwalan cerdas, industri AI sedang membentuk sebuah sistem industri Token yang belum pernah ada sebelumnya.
Namun, saat ini, sistem ini masih jauh dari matang.
Ada yang memiliki GPU paling canggih, tetapi terbatas oleh energi; ada yang membangun AIDC besar, tetapi kekurangan penjadwalan yang efisien; ada yang mengembangkan Agen AI yang kuat, tetapi menghadapi biaya inferensi tinggi dan latensi; ada yang menguasai node edge, tetapi tidak mampu membentuk jaringan kolaboratif yang terpadu. Rantai industri secara keseluruhan berkembang pesat, tetapi masih banyak fragmentasi, redundansi, dan hambatan efisiensi antar lapisan.
Hanya ketika ketujuh infrastruktur ini benar-benar terhubung, berkolaborasi, dan saling terintegrasi, industri AI akan benar-benar beralih dari "Era Alat" ke "Era Adopsi Skala Besar" dari dunia cerdas.
Kue lapisan pertama: Listrik — Energi di era AI
Revolusi industri bersaing untuk batu bara dan minyak; era internet bersaing untuk trafik dan server; sementara di era AI, perang paling dasar kembali ke energi.
Karena AI akhirnya mengkonsumsi listrik. Konsumsi listrik dari pusat data AI besar sudah mendekati sebuah kota menengah. Di seluruh dunia, pusat data AI (AIDC) baru sedang dibangun, menghadapi masalah yang sama: GPU bisa dibeli, tanah bisa dibangun, tetapi pasokan listrik tidak cukup, dan penjadwalan jaringan listrik juga tidak mampu mengikuti.
Itulah sebabnya semakin banyak perusahaan AI mulai kembali fokus pada infrastruktur energi. Di GTC 2026, Huang Renxun bahkan mendefinisikan pusat data masa depan sebagai "Pabrik Token". Bagian hulu pabrik ini akan melahirkan industri energi super.
Di pasar China, perusahaan seperti Yangtze Power, China Nuclear Power, China General Nuclear, Three Gorges Energy, Longyuan Power, dan Huadian New Energy mewakili arah energi utama seperti tenaga air, tenaga nuklir, tenaga angin, dan fotovoltaik. Di antara mereka, tenaga nuklir dan tenaga air karena kemampuan pasokan yang stabil menjadi sumber energi utama AIDC; sementara tenaga angin dan fotovoltaik mendapatkan manfaat dari meningkatnya permintaan energi hijau dan ESG di industri AI. Dengan kemajuan proyek "Data Timur, Pengolahan Barat" dan pembangunan pusat data AI besar, hubungan kolaboratif antara basis energi baru dan pusat daya komputasi semakin memperkuat.
Di pasar AS, perusahaan seperti NextEra Energy, Dominion Energy, Duke Energy, Southern Co., Exelon, juga mendapatkan manfaat dari ekspansi pusat data AI. Di antaranya, NextEra adalah pemimpin energi hijau di Amerika Utara; Dominion menguasai sumber transmisi utama di "Koridor Data Center" di Northern Virginia; Exelon, dengan kemampuan pasokan listrik stabil dari tenaga nuklir, menjadi penerima manfaat utama dari kebutuhan listrik "siaga 24/7" di era AI. Secara keseluruhan, industri listrik global sedang bertransformasi dari utilitas tradisional menjadi lapisan sumber daya utama infrastruktur AI.
Secara umum, pola kompetisi di lapisan ini sedang beralih dari "kompetisi harga listrik" perusahaan energi tradisional ke "kompetisi hak pengendalian listrik" antara pusat data AI, penyedia cloud, dan perusahaan energi. Siapa yang mampu mengamankan energi jangka panjang, stabil, dan berbiaya rendah, dia yang memegang "Batu Naga" pertama dalam produksi Token.
Kue lapisan kedua: AIDC — Pabrik bahan baku Token
Satu GPU saja tidak cukup, yang penting adalah klaster skala besar. Maka muncul AIDC.
Ia seperti pabrik baja, pembangkit listrik, dan jalur produksi di era industri, mengkonsolidasikan ribuan GPU untuk membentuk kapasitas produksi Token yang stabil. Tetapi, masalah pabrik juga mulai muncul: pembangunan AIDC tradisional biasanya memakan waktu 18 hingga 36 bulan, dan perluasan jaringan listrik bahkan bisa lebih lama. Ketika permintaan AI meningkat secara eksponensial, kecepatan pembangunan IDC lama tidak lagi mampu memenuhi ekonomi Token yang baru.
Di pasar saham AS, Equinix adalah salah satu operator pusat data terkemuka di dunia, dengan lebih dari 240 pusat data di lebih dari 30 negara. Keunggulan utamanya bukan hanya jumlah data center, tetapi kemampuan konektivitas global dan jaringan berlatensi rendah, menjadikannya titik infrastruktur penting untuk penyebaran daya komputasi AI.
Digital Realty melalui platform PlatformDIGITAL memasuki infrastruktur AI, melayani perusahaan cloud besar dan lembaga keuangan.
Di pasar China, Runze Technology adalah salah satu operator AIDC paling representatif di pasar A-share. Bisnis utamanya telah bertransformasi dari IDC tradisional ke pusat daya komputasi AI, dengan keunggulan di kapasitas data center besar, sumber listrik, dan kemampuan operasional AIDC. Perusahaan seperti AoFei Data dan Capital Online terus memperluas di bidang data center regional, infrastruktur cloud, dan pengelolaan daya komputasi AI. Sugon (Inspur) lebih fokus pada kerjasama di bidang pemerintah dan penelitian.
Selain itu, pemain lain berasal dari "transformasi tambang". Perusahaan seperti CoreWeave, IREN, Applied Digital, Cipher Mining, awalnya terkait dengan penambangan cryptocurrency, tetapi karena lonjakan permintaan GPU AI, mereka beralih cepat ke infrastruktur daya komputasi AI. IREN menonjolkan model "Energi hijau + Daya AI" melalui pembangunan pusat data GPU berbasis energi terbarukan. Applied Digital dan Cipher Mining juga bertransformasi dari tambang tradisional ke infrastruktur komputasi berkinerja tinggi AI.
Selain itu, tren baru muncul berupa pabrik AI yang bersifat edge, kecil, dan modular. Seperti halnya era internet dari mainframe ke cloud computing, daya komputasi AI mulai menyebar dari pusat besar ke node edge regional.
Oleh karena itu, GoodVision AI memilih jalur lain: membangun pabrik AI yang lebih ringan, modular, dan dapat diduplikasi dengan cepat. Dibandingkan AIDC besar tradisional, GoodVision AI lebih menekankan kemampuan deployment regional, efisiensi klaster GPU berkapasitas tinggi, serta kolaborasi energi dan daya komputasi.
Intinya bukan membangun pusat data besar tunggal, tetapi menempatkan node pabrik AI berkapasitas kecil 2-4MW di wilayah padat penduduk global, yang memungkinkan akses lebih cepat ke sumber energi lokal dan lebih cocok dengan tren penyebaran inferensi AI ke edge.
Jika AIDC tradisional lebih mirip pabrik baja industri, maka yang dibangun GoodVision AI lebih mirip "Pabrik Token Regional" di era AI — lebih ringan, fleksibel, dekat pengguna, dan lebih sesuai dengan arah pengembangan jaringan inferensi global di masa depan.
Kue lapisan ketiga: GPU — Perangkat produksi Token
Jika listrik adalah energi, maka GPU adalah perangkat produksinya. Dalam tahun-tahun awal ledakan AI, GPU terutama digunakan untuk pelatihan; tetapi di masa depan, kebutuhan terbesar akan inferensi. Karena pelatihan hanya dilakukan oleh beberapa perusahaan terkemuka, sementara inferensi akan meresap ke setiap aplikasi, perangkat, dan terminal. Robot membutuhkan inferensi, mobil otomatis membutuhkan inferensi, kacamata AI membutuhkan inferensi, bahkan kolaborasi antar Agen AI di masa depan juga akan menghabiskan Token secara real-time.
NVIDIA saat ini tetap menjadi pusat industri chip AI global. Produk GPU seperti H100, B200, Blackwell hampir mendefinisikan standar pelatihan dan inferensi AI global saat ini. Lebih penting lagi, NVIDIA tidak hanya menjual chip, tetapi juga membangun ekosistem lengkap melalui CUDA, TensorRT, DGX, HGX, dan lain-lain, sehingga pesaingnya harus menantang performa GPU sekaligus ekosistem perangkat lunak AI secara keseluruhan.
AMD adalah pesaing utama GPU saat ini, dengan produk utama seperti MI300X dan GPU AI lainnya. Dibandingkan NVIDIA, AMD lebih menekankan ekosistem terbuka dan platform perangkat lunak ROCm, berharap menarik pengembang dan perusahaan AI melalui pendekatan yang lebih terbuka.
Broadcom dan Marvell mewakili jalur lain — ASIC dan interkoneksi berkecepatan tinggi. Seiring semakin kompleksnya skenario inferensi AI, semakin banyak perusahaan mulai mencoba ASIC kustom untuk mendapatkan efisiensi energi yang lebih tinggi dan biaya lebih rendah.
Intel masuk ke pasar AI melalui CPU server dan kartu akselerasi Gaudi, berharap dapat bersaing kembali di infrastruktur AI dengan ekosistem CPU mereka sendiri.
Di pasar China, Cambricon adalah salah satu perusahaan chip AI domestik paling representatif, dengan seri SiYuan dan kerangka AI buatan sendiri Neuware. Hygon (Haiguang) memiliki lisensi arsitektur AMD Zen dan fokus pada pasar DCU dan inferensi AI.
Perusahaan GPU domestik seperti Moore Threads, Si Yuan Technology, Muxi Co., Ltd., dan Biren Technology mewakili arah "penggantian domestik" dalam chip AI China. Mereka umumnya menekankan kompatibilitas dengan ekosistem CUDA dan berusaha membangun klaster GPU domestik.
Dari ekosistem CUDA ke memori HBM, hingga Tensor Core, inti dari industri AI sebenarnya adalah terus meningkatkan "efisiensi pembuatan Token per satuan waktu". Sementara itu, GPU dan infrastruktur pendukung seperti server, modul optik, pendingin cair, dan switch juga sangat terkait dengan efisiensi produksi Token.
Hal-hal ini tidak secerah perusahaan aplikasi AI seperti NVIDIA dan OpenAI, tetapi mereka menentukan apakah dunia AI benar-benar dapat berjalan. Seperti revolusi industri yang tidak hanya membutuhkan mesin uap, tetapi juga rel kereta api, jaringan listrik, dan pelabuhan. Revolusi AI juga bukan sekadar revolusi perangkat lunak. Ini adalah peningkatan rantai industri global yang mencakup energi, chip, jaringan, komputasi awan, dan infrastruktur.
Vertiv adalah pemimpin global dalam UPS dan manajemen daya pusat data, menyediakan pasokan listrik, distribusi kabinet, dan sistem pendingin presisi.
Inverik adalah pemimpin di pasar China untuk sistem pendingin cair dan pengendalian suhu, dengan klien termasuk perusahaan internet besar seperti BAT. Dengan meningkatnya daya GPU, pendinginan cair mulai menjadi standar penting di AIDC.
Perusahaan seperti Zhongheng Electric, Kehua Data, dan Kesi Da juga memiliki posisi penting di bidang UPS, sistem daya, dan pasokan listrik IDC.
Di bidang jaringan dan modul optik, perusahaan seperti Zhongji Xuchuang, New Yisheng, dan Tianfu Communication mendapatkan manfaat dari lonjakan kebutuhan komunikasi berkecepatan tinggi di dalam klaster AI.
Di bidang server lengkap, perusahaan seperti Dell, HPE, Supermicro, Lenovo, dan Inspur bertanggung jawab atas perakitan dan pengiriman server AI dalam skala besar.
Lapisan ini meskipun tidak langsung berhadapan dengan pengguna akhir, tetapi menentukan apakah infrastruktur AI dapat berjalan secara stabil. Pendingin cair, UPS, modul optik, switch, penyimpanan energi, dan server lengkap seperti rel, jaringan listrik, dan pelabuhan di era industri, kini menjadi "bisnis penjual sekop" yang sebenarnya di dunia AI.
Kue lapisan keempat: LLM — Mesin produksi Token
LLM (Model Bahasa Besar) menentukan bagaimana Token dipahami, dihasilkan, dan diorganisasi. Dalam dua tahun terakhir, OpenAI, Anthropic, Google, Meta, xAI, DeepSeek dan lainnya memulai kompetisi "Model Besar" global. Jumlah parameter dari ratusan miliar meningkat menjadi triliunan, kemampuan model juga berkembang dari generasi teks ke multimodal, inferensi, kode, kolaborasi Agen, dan memori jangka panjang.
Namun, seiring perkembangan industri, pasar mulai menyadari: yang benar-benar penting di masa depan bukan lagi "siapa yang memiliki model terbesar", tetapi siapa yang mampu menjalankan model dengan biaya lebih rendah dan efisiensi lebih tinggi secara berkelanjutan. Karena model itu sendiri tidak langsung menciptakan nilai, yang benar-benar menciptakan nilai adalah proses inferensi yang terus-menerus dipanggil dari model tersebut.
Ini juga berarti bahwa LLM sedang bertransformasi dari "menampilkan kemampuan model" menjadi "mesin produksi Token" di dunia AI.
Model tertutup dan terbuka seperti OpenAI, Anthropic, Google Gemini, Meta Llama, sedang bersaing untuk menguasai pintu masuk ekosistem AI masa depan; sementara pemain baru seperti DeepSeek mulai membangun kembali pola kompetisi industri melalui biaya inferensi yang lebih rendah dan efisiensi yang lebih tinggi. Saat ini, kompetisi di lapisan LLM tidak lagi semata-mata tentang jumlah parameter, tetapi beralih ke berbagai dimensi perbandingan:
Biaya Token, Efisiensi Inferensi, Kemampuan Konteks, Multi-Agent Kolaborasi, Memori Jangka Panjang, Kemampuan Koordinasi Model dan Infrastruktur
Karena yang benar-benar penting di era AI bukan hanya "model besar yang cerdas", tetapi apakah model tersebut dapat dijalankan secara berkelanjutan, massal, dan dengan biaya rendah di seluruh dunia. GoodVision AI juga memiliki solusi optimisasi sendiri di lapisan ini: bekerja sama dengan produsen model besar untuk menempatkan model besar di pusat data AI Factory, beralih dari bisnis sewa daya komputasi tradisional ke penyediaan layanan Token langsung; tidak hanya meningkatkan margin bisnis, tetapi juga membuat pengalaman pengguna lebih ramah.
Kue lapisan kelima: Distribusi Token — "Jaringan listrik" di era AI
Setelah AIDC selesai dibangun, muncul pertanyaan berikutnya: bagaimana daya komputasi ini digunakan di seluruh dunia?
Maka, platform penyewaan daya komputasi mulai muncul. Mereka seperti "sistem jaringan listrik" di era AI, memecah dan mendistribusikan sumber daya GPU yang terpusat, lalu menyewakannya sesuai kebutuhan kepada pengembang, perusahaan, dan aplikasi AI.
AWS, Azure, Google Cloud, Alibaba Cloud, Tencent Cloud tetap menjadi pemain terkuat di lapisan ini. Mereka memiliki infrastruktur cloud terbesar di dunia dan secara bertahap memasukkan sumber daya GPU AI ke dalam sistem IaaS mereka sendiri.
Namun, bersamaan itu, muncul sejumlah "cloud asli AI" yang berkembang pesat. Perusahaan seperti CoreWeave, Nebius, Nscale, secara khusus membangun platform cloud GPU untuk kebutuhan pelatihan dan inferensi AI. Dibandingkan penyedia cloud tradisional, mereka lebih fleksibel, lebih fokus pada tugas AI, dan lebih ahli dalam mengoptimalkan klaster GPU.
CoreWeave adalah salah satu perusahaan paling representatif di NeoCloud saat ini. Awalnya fokus pada penambangan Ethereum, kemudian beralih sepenuhnya ke layanan cloud GPU AI, dan kini menjadi perusahaan infrastruktur AI yang didukung utama oleh NVIDIA.
DigitalOcean, Vultr, dan platform cloud ringan lainnya menargetkan pengembang kecil dan startup, menekankan deployment cepat dan biaya rendah untuk layanan GPU.
Di pasar China, selain raksasa, perusahaan seperti UCloud, Kingsoft Cloud, dan Capital Online adalah penyedia utama layanan cloud GPU dan sewa daya komputasi AI. Pola kompetisi di lapisan ini sangat mirip dengan jaringan listrik awal: bagaimana mendistribusikan daya komputasi yang tersebar secara efisien.
Kue lapisan keenam: Optimisasi Token dan Penjadwalan Cerdas — Otak di era AI
Ini mungkin lapisan yang paling sering diremehkan tetapi juga paling penting. Setelah penggunaan Agen AI melonjak, orang menyadari bahwa tidak semua tugas layak memanggil model besar yang paling mahal. Banyak tugas sederhana bisa diselesaikan oleh model lokal; banyak tugas real-time lebih cocok diproses di edge; tugas yang melibatkan privasi tinggi bahkan tidak bisa diunggah ke cloud. Setelah masalah "tersedia daya" teratasi, muncul pertanyaan baru: "Bagaimana menggunakan daya secara lebih cerdas?"
Dengan permintaan Token yang meningkat secara eksponensial, "menempatkan model yang tepat pada daya yang tepat untuk tugas yang tepat" menjadi kunci agar Token digunakan secara rasional dan efisien. Ini adalah salah satu fokus yang sedang dikerjakan GoodVision AI selain membangun pabrik Token AI.
Seperti sistem listrik hari ini: beberapa kebutuhan berasal dari jaringan listrik utama; beberapa dari panel surya di atap. Yang benar-benar penting adalah lapisan "penjadwalan cerdas" di tengah.
Masa depan AI juga akan memiliki struktur yang sama: tugas sederhana diselesaikan oleh model kecil lokal, tugas kompleks memanggil model besar di cloud, tugas privasi tinggi diproses di edge, dan tugas dengan permintaan tinggi dijadwalkan secara dinamis melalui hybrid cloud.
Selain GoodVision AI, perusahaan seperti QingCloud, Lambda, OpenRouter, Fireworks AI juga unggul dalam optimisasi Token dan penjadwalan cerdas.
Lapisan "kue" ini sangat tumpang tindih dengan dua lapisan sebelumnya — AIDC dan platform cloud GPU. Ketika sumber daya GPU, node regional, dan skala inferensi meningkat, sekadar "memiliki daya" tidak lagi cukup untuk membangun keunggulan jangka panjang. Semakin banyak operator AIDC dan platform cloud GPU menyadari bahwa yang benar-benar menentukan efisiensi dan margin keuntungan di masa depan bukan hanya jumlah GPU, tetapi bagaimana secara dinamis menjadwalkan model, daya, dan lalu lintas Token.
Oleh karena itu, banyak platform yang awalnya fokus pada AIDC dan cloud GPU mulai memperluas ke "lapisan penjadwalan cerdas". Contohnya, perusahaan seperti UCloud, Capital Online, Sugon, sedang mencoba mengintegrasikan fasilitas cloud GPU mereka dan kemampuan penjadwalan inferensi, bertransformasi dari "menjual daya" menjadi "mengoptimalkan daya".
Kue lapisan ketujuh: Model dan Agen — Pengguna Token
Lapisan ini meskipun paling dekat dengan pengguna dan paling mudah mendapatkan trafik, tetapi kompetisinya juga paling sengit. Di GTC 2026, Huang Renxun menyampaikan pandangan: di masa depan, setiap perusahaan akan menjadi "Produsen dan Konsumen Token".
Sebuah Agen AI mungkin akan memanggil banyak model, berbagai alat, dan API secara bersamaan, serta terus melakukan inferensi, perencanaan, dan eksekusi. Ini berarti, jumlah Token yang dikonsumsi AI di masa depan akan jauh melebihi skala percakapan manusia dan AI saat ini. Beberapa pengguna AI berat saat ini membangun sistem multi-Agen yang berjalan paralel dan saling memanggil, menghabiskan 1 miliar Token per hari bukan hal yang aneh.
Masa depan bukan lagi 10 miliar orang yang menggunakan AI, tetapi 100 miliar, bahkan 1 triliun Agen AI yang bekerja secara bersamaan dan saling berinteraksi. Bottleneck utama akan beralih dari "kemampuan model" ke "efisiensi penjadwalan Token".
Raksasa teknologi seperti Microsoft, Google, Meta, Amazon, secara alami tidak perlu banyak dikatakan, mereka mengintegrasikan kemampuan AI ke dalam sistem kerja, pencarian, jejaring sosial, dan layanan cloud mereka secara bertahap.
Perusahaan perangkat lunak perusahaan seperti Adobe, Salesforce, ServiceNow, Palantir, juga mempercepat pengembangan Agen AI dan otomatisasi workflow. Sementara itu, Hugging Face sedang menjadi "Github" di era AI. Mereka bukan hanya komunitas model, tetapi juga infrastruktur penting dalam ekosistem pengembangan AI global.
Di pasar China, perusahaan seperti iFlytek, Kunlun Wanshi, 360, Kingsoft Office, dan SenseTime sedang mengembangkan layout terkait asisten AI, kantor AI, dan Agen AI.
Ketika "kue tujuh lapisan" benar-benar terbentuk, dunia AI akan benar-benar mulai
Saat ini, industri AI masih berada dalam sistem infrastruktur yang belum sepenuhnya matang.
Ada yang memiliki GPU paling canggih, tetapi terbatas oleh energi; ada yang membangun AIDC besar, tetapi kekurangan penjadwalan efisien; ada yang mengembangkan model dan Agen yang kuat, tetapi menghadapi biaya inferensi tinggi dan latensi; ada yang menguasai node edge, tetapi tidak mampu membentuk jaringan kolaboratif yang terpadu.
Dari listrik, AIDC, GPU, hingga LLM, distribusi Token, penjadwalan cerdas, dan Agen AI, seluruh rantai industri AI meskipun berkembang pesat, masih banyak fragmentasi, redundansi, dan hambatan efisiensi antar lapisan.
Hanya ketika sistem "kue tujuh lapisan" ini benar-benar lengkap dan mulai berkolaborasi secara efisien, industri AI akan benar-benar beralih dari "Era Alat" ke "Era Adopsi Skala Besar" dari dunia cerdas.
Masa depan dunia AI tidak lagi didominasi oleh beberapa perusahaan besar yang melatih model besar, tetapi oleh ratusan miliar Agen AI yang terus online, berkolaborasi, dan memanggil daya serta Token secara terus-menerus. Setiap percakapan, inferensi, panggilan alat, dan eksekusi otomatis di baliknya melibatkan kolaborasi energi, GPU, jaringan, sistem penjadwalan, dan node inferensi.
Ini juga berarti bahwa industri AI sedang bertransformasi dari "logika perangkat lunak" menjadi sebuah sistem industri super yang mencakup energi, chip, komputasi awan, jaringan edge, dan penjadwalan cerdas.
Seperti revolusi industri yang tidak hanya membutuhkan mesin uap, tetapi juga rel kereta api, jaringan listrik, dan pelabuhan; revolusi internet tidak hanya membutuhkan PC, tetapi juga serat optik, pusat data, dan komputasi awan. Tanda kedewasaan revolusi AI bukan hanya muncul dari satu aplikasi populer, tetapi dari terbentuknya jaringan infrastruktur cerdas global yang mampu terus memproduksi, mendistribusikan, menjadwalkan, dan mengonsumsi Token secara berkelanjutan.
Ketika infrastruktur "kue tujuh lapisan" ini akhirnya terhubung secara lengkap, logika kompetisi industri AI akan benar-benar dirombak. Perusahaan paling penting di masa depan mungkin bukan lagi yang memiliki model terbesar, tetapi yang mampu menghubungkan energi, daya, jaringan, model, dan aliran Token secara terpadu.