Token menjadi “Binatang Penelan Uang” kekuatan komputasi perusahaan besar melonjak gila

robot
Pembuatan abstrak sedang berlangsung

你有没有发现,这半年 dunia AI 风格变得有点快?

去年这个时候,大家还在为算力降价狂欢。阿里云带头喊出“最高降幅60%”,腾讯云、华为云、百度云齐刷刷跟上,那阵仗,简直像双十一大促。创业群里天天有人晒账单:“Lihat, Token 1M saya ini cuma habis beberapa sen!” Saat itu semua orang merasa, musim semi untuk bisnis rintisan AI sudah datang, harga算力 semurah sayur, siapa lagi yang tidak mampu membuat aplikasi model besar?

Lalu bagaimana? “Tamparan” datang terlalu cepat.

Bulan lalu saja, arah angin berputar 180 derajat. Google, Amazon, Tencent, Alibaba, Baidu, dalam waktu 10 hari semuanya mengeluarkan pengumuman kenaikan harga. Naik berapa? Umumnya 30% sampai 50%. Yang paling ekstrem adalah Tencent Cloud—ada produk intinya yang langsung naik 400%.

Dari “obral besar-besaran ala lompat dari gedung” sampai “kenaikan harga model roket”, kurang dari setahun. Lalu apa yang sebenarnya terjadi? Siapa yang mendorong harga naik di belakang layar? Dan yang lebih penting, dalam gelombang kenaikan harga ini, siapa yang paling menderita, dan siapa yang diam-diam tersenyum?

Tahun lalu masih “diskon besar”, tahun ini mengapa semuanya justru menaikkan harga?

Pertama, mari kita ingat sebentar “drama pembalikan besar” ini.

Pada April 2025, Alibaba Cloud lebih dulu melempar bom besar: penurunan harga maksimal 60% untuk produk inti. Ini bukan sekadar main-main, melainkan benar-benar “dipotong separuh lalu didiskon lagi”. Setelah itu, JD Cloud mengatakan “turun saja semaumu, aku ikut”, lalu Tencent Cloud, Huawei Cloud, dan Baidu Cloud semuanya menyusul. Dalam sekejap, pasar komputasi dipenuhi asap bubuk perang, perang harga berlangsung begitu meriah.

Saat itu, slogan apa? “Agar AI terjangkau” dan “komputasi yang inklusif”. Banyak perusahaan rintisan benar-benar percaya, lalu mulai membakar Token secara besar-besaran dan menjalankan model.

Namun, makan siang gratis memang tidak pernah bisa bertahan lama.

Pada Januari 2026, Amazon AWS diam-diam melakukan sesuatu—tanpa konferensi pers, tanpa pengumuman apa pun, langsung menaikkan harga server EC2 sekitar 15%. Jangan lihat peningkatannya tidak terlalu besar, maknanya justru besar: ini adalah pertama kalinya dalam hampir dua puluh tahun industri layanan cloud mengalami kenaikan harga. Perlu diketahui, selama dua puluh tahun terakhir, jumlah kali AWS menurunkan harga lebih dari 100 kali—dan selama ini hanya ada penurunan, tidak pernah ada kebiasaan menaikkan.

Langkah ini seperti mendorong domino.

Pada 11 Maret, Tencent Cloud menyusul. Di bawahnya, model Tencent HY2.0 Instruct: harga input dari 0.0008 yuan/1000 tokens naik menjadi 0.004505 yuan/1000 tokens—kenaikan 463%, lebih dari empat kali lipat. Pada 18 Maret, Alibaba Cloud mengumumkan produk kartu komputasinya naik 5% sampai 34%, dan Baidu Intelligent Cloud juga ikut naik 5% sampai 30%. Model-model besar yang sebelumnya gratis untuk uji publik—seperti GLM 5, MiniMax 2.5, Kimi 2.5—semuanya mengakhiri masa “coba-coba gratis”, lalu masuk ke penagihan resmi.

Dari “saling berebut menurunkan harga” menjadi “saling berebut menaikkan harga”—kenapa perubahannya begitu cepat?

Secara permukaan, karena vendor cloud tidak tahan lagi. Harga chip GPU makin mahal, biaya listrik pusat data mencapai 40% sampai 60% dari biaya operasional, ditambah pada paruh kedua 2025 chip penyimpanan juga mulai naik harga—tekanan dari sisi biaya benar-benar menekan. Tapi alasan yang benar-benar membuat kenaikan harga jadi “terpaksa dilakukan” adalah yang lebih mendasar: komputasi, memang benar-benar tidak cukup digunakan.

Siapa yang gila “mengonsumsi” Token? Kejelasan tentang 140 triliun

Bukankah sebelumnya bilang komputasi berlebih? Kok tiba-tiba jadi tidak cukup?

Jawabannya: Token dimakan terlalu cepat.

Berdasarkan data yang diungkapkan oleh kepala Badan Urusan Data Negara Liu Liehong pada bulan Maret tahun ini: pada Maret 2026, total panggilan Token harian di Tiongkok sudah menembus 140 triliun.

Seberapa “keterlaluan” angka ini? Saya beri dua perbandingan:

· Pada awal 2024, angka ini hanya 100 miliar. Dalam dua tahun, naik lebih dari seribu kali.

· Pada akhir 2025, angkanya 100 triliun. Artinya, hanya dalam tiga bulan terakhir, naik lagi 40%—dan tambahan volume selama tiga bulan saja (40 triliun) adalah 400 kali lipat dari seluruh total angka pada awal 2024.

Ini bukan pertumbuhan linear, ini seperti tsunami.

Lalu pertanyaannya: siapa yang secara gila-gilaan menghabiskan Token?

Jawabannya cuma satu kata: agen (Agent).

Mulai tahun lalu, produk yang dipimpin oleh open-source agent OpenClaw (“Lobster”, julukan di kalangan pengguna) sangat populer. AI berubah dari robot yang hanya bisa “ngobrol” menjadi asisten yang bisa “bekerja”—membantu memesan tiket pesawat, menulis kode, membuat PPT, menganalisis data… terdengar keren, kan? Tapi konsekuensinya: ketika agent melakukan satu tugas sederhana, jumlah Token yang dikonsumsi adalah 10 sampai 100 kali lipat dibanding percakapan biasa.

Contoh: kalau AI membantu kamu menulis skrip crawler. Jika itu percakapan biasa, ia memberimu sepotong kode, lalu kamu tinggal salin dan selesai—Token yang habis hanya beberapa ratus. Tapi kalau itu agent, ia harus menjalankan kodenya sendiri, melaporkan error, debug, menjalankan lagi, menjalankan lagi… bolak-balik belasan putaran, sehingga konsumsi Token langsung menembus puluhan ribu.

Belum lagi video generation—ini “pemakan Token” yang paling ganas. Ada analisis yang menyebut, menghasilkan video 1 menit kira-kira mengonsumsi sekitar 10 triliun Token. Dan sekarang, model video menghasilkan video 5 detik, biayanya hanya beberapa sen sampai beberapa dolar—ini jelas bukan cari untung, melainkan rugi untuk promosi. Tapi walau begitu, jumlah pengguna terus banyak: video, musik, kode, analisis data… di setiap arah, semuanya gila-gilaan “memakan” Token.

Karena pasokan tidak mengejar permintaan, harga komputasi otomatis naik. Ini bukan konspirasi, ini ketidakseimbangan pasokan-permintaan yang telanjang.

Kompetisi peringkat komputasi: perusahaan besar makan daging, pemain kecil bahkan tidak dapat sup

Soal kenaikan harga, maknanya sepenuhnya berbeda bagi orang yang berbeda.

Bagi vendor cloud, kenaikan harga justru kabar baik. Ada pihak analis sekuritas yang menghitung: setiap kali Alibaba Cloud menaikkan harga 1%, profit margin-nya bisa naik 1 poin persentase. Jadi data yang kamu lihat adalah: porsi Alibaba Cloud tidak turun, justru naik—sudah mencapai 36% dari pasar cloud AI di Tiongkok. Dan di jalur yang lebih spesifik lagi, yaitu panggilan AI, Volcano Engine (di bawah ByteDance) bahkan menguasai hampir 50%—artinya, setengah dari seluruh panggilan Token di Tiongkok lewat pipa Volcano Engine.

Sementara itu, porsi Huawei Cloud dan Tencent Cloud sedikit menurun. Efek dominan makin jelas: perusahaan besar makin kuat, sumber daya makin terkonsentrasi.

Lalu siapa yang paling menderita?

Perusahaan rintisan AI menengah-kecil, serta para pemain baru yang baru masuk.

Sebabnya sederhana: kenaikan harga langsung mendorong biaya operasional mereka. Dulu saat Token murah, kamu bisa menjalankan eksperimen sesuka hati dan mengutak-atik model sesuka hati—bagaimanapun tidak menghabiskan banyak biaya. Sekarang harga naik beberapa kali bahkan belasan kali—setiap putaran pelatihan, setiap kali inferensi, harus menimbang dan mengukur.

Yang lebih merepotkan: pemain kecil tidak punya kemampuan untuk bernegosiasi harga. Pelanggan besar bisa menandatangani kontrak jangka panjang dengan vendor cloud, mengunci harga yang relatif lebih murah. Kamu yang baru memulai, dalam setahun hanya menghabiskan puluhan ribu untuk biaya komputasi—siapa yang mau bicara diskon untukmu? Akhirnya hanya bisa membayar sesuai harga yang sudah naik.

Banyak proyek yang semula berniat membuat aplikasi AI, setelah menghitung biaya, diam-diam menunda. Ada juga yang sudah berjalan: ada yang mengurangi skala, atau tetap bertahan menanggung kerugian sendiri. Dan kebetulan persaingan di pasar pengguna akhir sangat ketat—kamu tidak berani menaikkan harga ke pengguna dengan mudah: kalau kamu naik, pesaing sebelah masih gratis. Begitu kamu charge, pengguna langsung lari. Pada akhirnya, semua tekanan biaya harus kamu telan sendiri.

Seorang praktisi mengeluh ke saya: “Dulu saya pikir komputasi murah, sehingga hambatan masuk rendah. Baru sekarang saya sadar: hambatan itu bukan diturunkan—tapi justru dibuka untuk kamu masuk, lalu pintunya ditutup.”

Ini sebenarnya kompetisi peringkat yang kejam. Dalam dua puluh tahun terakhir, vendor cloud bisa hidup nyaman dengan strategi “harga murah untuk volume, lalu menguasai wilayah dulu baru menghasilkan uang.” Tapi era itu berakhir. Masa subsidi untuk komputasi sudah resmi selesai, masuk ke fase penetapan harga komersial. Ke depan, yang tidak lagi bersaing siapa yang paling murah, melainkan siapa yang layanan paling stabil, ekosistemnya paling lengkap, dan siapa yang bisa membantu perusahaan memanfaatkan setiap jatah komputasi dengan benar.

Dan dalam kompetisi peringkat ini, pemain kecil kemungkinan besar akan terlempar dari kereta.

Kalau melihat roller coaster setahun lebih ini, kamu akan menemukan kebenaran yang menyakitkan:

Dari “harga sayur” menjadi “harga roket” untuk komputasi, pada dasarnya adalah cerminan dari industri AI yang bergeser dari pertumbuhan liar menuju kedewasaan. Era gratis selesai, persaingan nilai dimulai. Model bisnis yang hidup dengan subsidi akan mati, sementara produk yang benar-benar punya teknologi, punya skenario, dan punya pengguna, akan bertahan di lingkungan kenaikan biaya komputasi—bahkan bisa hidup lebih baik.

Kekuatan inti bisnis rintisan AI, tidak pernah soal komputasinya seberapa murah, melainkan kamu menggunakan komputasi untuk apa.

Di era komputasi, Token memang mahal. Tapi yang lebih mahal daripada Token adalah sebuah otak yang tahu cara memanfaatkan Token dengan baik.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan