Token adalah “mata uang baru” di era AI. Pada tahun 2024, perang harga AI dimulai, Token dihargai dalam “厘”; pada tahun 2026, permintaan daya komputasi meledak, produsen model dan penyedia cloud secara kolektif menaikkan harga Token mereka.

Dalam dua tahun terakhir, industri model besar mengalami perubahan drastis dari perang harga ke perang nilai, nilai Token sedang dipandang kembali. Di luar gaji, bonus, dan saham, Token bahkan menjadi alat negosiasi gaji baru bagi insinyur Silicon Valley. Penataan ekosistem dan perebutan sumber daya terkait Token telah dimulai.

Dari gelombang penurunan harga ke gelombang kenaikan harga

Pada tahun 2026, produsen model dan penyedia cloud secara kolektif menaikkan harga Token mereka. Sejak awal tahun ini, Zhipu telah mengeluarkan dua pengumuman kenaikan harga. Pada 16 Maret, Zhipu meluncurkan model dasar GLM-5-Turbo yang dioptimalkan untuk skenario OpenClaw, dengan kenaikan harga API sebesar 20%. Dalam paket “Lobster” untuk pengguna individu dan perusahaan, kartu pengalaman bulanan 39 yuan/bulan, termasuk 35 juta Token, dan kartu pengalaman lanjutan 99 yuan/bulan, termasuk 100 juta Token. Pada Februari, Zhipu mengumumkan penyesuaian harga Coding Plan, “karena permintaan pasar untuk GLM Coding Plan terus tumbuh kuat, jumlah pengguna dan volume panggilan meningkat pesat,” memutuskan untuk menghapus diskon pembelian pertama, mempertahankan diskon langganan kuartalan dan tahunan, dengan kenaikan harga paket secara keseluruhan mulai dari 30%.

Selain produsen model, penyedia cloud juga menaikkan harga secara kolektif. Karena langganan Coding Plan sangat laris, API model Alibaba Cloud melonjak, mengumumkan penyesuaian diskon pembelian pertama secara sementara, dengan pasokan terbatas setiap hari, sampai habis. Pada 18 Maret, Alibaba Cloud menyatakan bahwa karena ledakan permintaan AI global dan kenaikan biaya rantai pasok, biaya pengadaan perangkat keras inti industri meningkat secara signifikan, mulai 18 April akan menyesuaikan harga layanan daya komputasi AI, CPFS (versi kecerdasan), dan lainnya. Layanan terkait kartu daya komputasi seperti Pingtouge Zhenwu 810E naik 5%-34%, CPFS (versi kecerdasan) naik 30%.

Cloud AI Baidu juga mengumumkan bahwa mulai 18 April, produk dan layanan daya komputasi AI akan naik sekitar 5%-30%, dan penyimpanan file paralel juga naik sekitar 30%. Tencent Cloud mengumumkan bahwa mulai 13 Maret, model GLM 5, MiniMax 2.5, Kimi 2.5 telah selesai uji publik dan beralih ke layanan komersial resmi, berdasarkan biaya penggunaan model. Harga model seri Hun Yuan juga mengalami penyesuaian, harga input model Tencent HY2.0 Instruct dari 0,0008 yuan/seribu token naik menjadi 0,004505 yuan/seribu token, dan harga output dari 0,002 yuan/seribu token naik menjadi 0,01113 yuan/seribu token.

Namun, dua tahun lalu, gelombang penurunan harga Token masih segar dalam ingatan.

Pada tahun 2024, “Perang Seratus Model”, industri model besar saat itu masih dalam perang harga sengit, penyedia cloud dan produsen model saling menurunkan harga dan memberi Token gratis.

Pada Mei tahun itu, ByteDance memulai perang harga model besar dengan harga 0,0008 yuan/seribu token, diikuti oleh Alibaba Cloud yang mengumumkan bahwa Tongyi Qianwen menurunkan harga hingga 97%, saat itu model utama Tongyi Qianwen GPT-4 level, Qwen-Long, harga input dari 0,02 yuan/seribu token turun menjadi 0,0005 yuan/seribu token. Pada waktu yang sama, kuota bonus pengguna baru Zhipu meningkat dari 5 juta Token menjadi 25 juta Token.

DeepSeek, yang melatih model besar berkinerja tinggi dengan biaya lebih rendah, mengungkapkan informasi kunci di balik sistem inferensi V3/R1 mereka pada Maret tahun lalu, melalui optimisasi throughput dan latensi, jika semua Token dihitung berdasarkan harga DeepSeek-R1, margin biaya-keuntungan bisa mencapai 545%.

Teknologi adalah dasar penurunan harga model. Tan Taiming, Presiden platform layanan cloud ByteDance Volcano Engine, menyatakan dalam gelombang penurunan harga AI 2024 bahwa logika dasar penurunan harga adalah percaya diri menggunakan teknologi untuk menurunkan biaya, dan pasar juga membutuhkan model besar dengan harga lebih rendah.

“Dua tahun lalu, permintaan daya komputasi lebih banyak berasal dari perusahaan, sekarang adalah ‘kelaparan’ daya komputasi pribadi, mendorong model bisnis startup AI dan perusahaan besar beralih ke konsumsi Token,” kata Tian Feng, Direktur Institut Riset Industri AI SenseTime dan pendiri sebelumnya.

Dalam dua tahun terakhir, model berkembang pesat, aplikasi agen cerdas meningkat secara signifikan, sehingga permintaan daya komputasi terus meningkat, kapasitas GPU inferensi dengan rasio harga-kinerja tinggi terbatas, dan biaya perangkat keras inti serta infrastruktur terkait meningkat secara signifikan. Bernard Golden, CEO Navica, perusahaan analisis, konsultasi, dan investasi teknologi Silicon Valley, menyatakan seluruh industri sedang mencari lebih banyak daya komputasi secara gila-gilaan.

Ketidakseimbangan penawaran dan permintaan membuat kenaikan harga menjadi hal yang tak terhindarkan.

“Model yang lebih pintar dapat menjalankan tugas yang lebih kompleks, sumber daya yang dikonsumsi sangat besar,” kata Zhang Peng, CEO Zhipu, saat menanggapi strategi kenaikan harga, bahwa proses eksekusi agen cerdas melibatkan rantai pemikiran dan inferensi yang lebih panjang, berinteraksi dengan infrastruktur dasar melalui penulisan kode, terus melakukan debugging dan koreksi kesalahan, sehingga jumlah Token yang dibutuhkan untuk menyelesaikan satu tugas adalah sepuluh kali bahkan seratus kali lipat dari menjawab pertanyaan sederhana. Inti dari penyesuaian harga adalah perubahan biaya, “model yang lebih besar dan lebih kuat, biaya layanan yang sesuai juga meningkat, jadi kami berharap dapat mengembalikannya secara bertahap ke kisaran nilai bisnis yang normal, bergantung pada harga murah secara jangka panjang tidak menguntungkan perkembangan industri.”

Pertumbuhan volume panggilan Token dua tahun meningkat seribu kali lipat

Dalam dua tahun terakhir, penyedia perangkat lunak secara bertahap mengintegrasikan kemampuan generasi teks, gambar, dan suara ke platform layanan pelanggan, materi pemasaran, robot layanan, dan produk lain melalui antarmuka API standar. Pengguna perusahaan memanggil kemampuan model besar melalui API, berdasarkan volume panggilan atau langganan, menurunkan hambatan penggunaan dan investasi awal. Sebab, biaya satu GPU H100 sekitar 25.000 dolar AS, dan pengeluaran untuk mengonfigurasi beberapa GPU dalam satu sistem akan lebih tinggi.

Model layanan ini memungkinkan model besar menjangkau pengguna dalam jumlah besar dengan cepat, volume panggilan Token melonjak tajam. Kepala Biro Data Nasional Liu Liehong mengungkapkan bahwa hingga akhir 2025, lebih dari 100.000 dataset berkualitas tinggi telah dibangun di seluruh negeri. Pada Maret tahun ini, volume panggilan Token harian di China telah melebihi 140 triliun, meningkat lebih dari 1000 kali dari awal 2024 yang sebesar 100 miliar, dan dalam tiga bulan terakhir meningkat lebih dari 40% dibandingkan akhir 2025 yang sebesar 100 triliun.

Tian Feng mengatakan kepada Pengpai Tech bahwa pada 2024, permintaan daya komputasi untuk pelatihan melebihi 50%, dan pada 2025, situasinya akan sepenuhnya berbalik. Jika dua tahun lalu adalah perang seratus model, sekarang adalah perang seratus “udang”.

Permintaan inferensi yang besar, layanan inferensi yang terkait erat dengan konsumsi Token, adalah skenario daya terbesar dan tercepat pertumbuhannya saat ini. Kinerja model yang terus meningkat mendorong lonjakan konsumsi Token, dan aplikasi agen cerdas seperti “Lobster” (OpenClaw) yang menyebar luas menyebabkan ledakan permintaan Token. OpenClaw dijuluki sebagai “Lubang Hitam Token”. Bagi perusahaan dan individu yang menggunakan Lobster, Token adalah hambatan biaya terbesar.

Tian Feng menyatakan bahwa konsumsi Token untuk agen cerdas yang secara otomatis menjalankan tugas adalah 4-15 kali lipat dari tanya jawab tradisional. Pengusaha AI Luo Xuan menggunakan OpenClaw untuk menyelesaikan tugas riset kompleks membutuhkan ratusan juta bahkan lebih banyak Token. Untuk mendapatkan Token yang lebih murah, pengalaman dia adalah mendaftar sebagai pengguna baru dari penyedia cloud atau model, mendapatkan Token gratis, tetapi tetap mengeluh, “Token terlalu mahal.”

Penggunaan daya komputasi untuk pemrograman, obrolan, dan pekerjaan kantor didasarkan pada Token, dan dari sudut pandang konsumsi daya yang lebih luas, generasi gambar berdasarkan jumlah gambar, dan pembuatan video berdasarkan durasi dan resolusi juga mengonsumsi banyak daya. Contohnya, penutupan aplikasi video Sora oleh OpenAI menunjukkan hal ini. Menjalankan layanan pembuatan video membutuhkan sumber daya komputasi dan listrik yang besar, yang merupakan beban biaya besar bagi perusahaan mana pun, dan penutupan Sora akan membebaskan banyak sumber daya daya komputasi.

Permintaan daya komputasi tidak hanya meningkatkan kebutuhan GPU, tetapi semua perangkat keras terkait juga akan berfluktuasi dan menjadi faktor pembatas.

“Termasuk pendinginan, pencahayaan, listrik server, biaya listrik pusat data sekitar 60%, saat ini harga energi seperti minyak dan gas alam sedang naik, dan siklus kenaikan memori selama 5 tahun,” kata Tian Feng. Biaya energi dan perangkat keras mendorong kenaikan harga daya komputasi.

Huang Zhiming, Wakil Presiden Cisco dan CEO Greater China, mengatakan kepada Pengpai Tech bahwa dalam jangka pendek, investasi perangkat keras untuk membangun pabrik tidak bisa selesai dalam satu atau dua bulan, dan fluktuasi penawaran dan permintaan akan terus berlangsung. Shilong, Wakil Presiden Senior dan CTO Cisco Greater China, menambahkan bahwa kapasitas produksi yang memenuhi permintaan membutuhkan sekitar dua tahun, “penyesuaian pabrik memori setidaknya membutuhkan dua tahun, dan tidak akan membaik sebelum akhir 2027, membangun ulang pabrik dan menata jalur produksi tidak semudah itu.” Namun, Huang Zhiming berpendapat bahwa dengan meningkatnya jumlah pengguna dan penerapan, biaya akan secara bertahap menjadi lebih umum dan murah.

Yao Xin, pendiri Piao Cloud Computing (Shanghai), mengatakan kepada Pengpai Tech bahwa saat ini, hambatan utama untuk AI dan daya komputasi bukanlah chip kelas atas, melainkan teknologi TI umum dan komponen pendukung tradisional. Selama sepuluh tahun terakhir, industri infrastruktur TI tradisional seperti memori, hard disk, dan switch telah tumbuh secara stabil seiring dengan pertumbuhan PDB global, dan ekspektasi permintaan jangka panjang menentukan laju ekspansi kapasitas yang moderat. Tetapi ledakan pertumbuhan AI telah mematahkan keseimbangan ini. Pengiriman GPU meningkat pesat, dan komponen pendukung lainnya tidak mampu mengikuti permintaan yang “membelok”. “Chip kelas atas kapasitas produksinya sudah meningkat, tetapi kapasitas lain belum mengikuti. Tentu saja, gelombang ini menyakitkan semua orang, sehingga komponen tradisional seperti memori dan hard disk pun memperluas produksi.”

Perpaduan pasokan dan permintaan, akhirnya menjadi stabil

“Sekarang Token lebih mahal dari magang, dalam tiga sampai lima tahun pasti akan lebih murah,” kata Tian Feng, yang juga percaya bahwa harga Token di masa depan pasti akan menurun.

Dia berpendapat bahwa, dalam jangka pendek, kenaikan harga daya komputasi disebabkan oleh ketidakseimbangan penawaran dan permintaan. Tetapi dari siklus semikonduktor, industri manufaktur memiliki siklus kapasitas, setelah ekspansi kapasitas baru, pasokan pasar akan melimpah, menekan harga, bahkan menyebabkan kelebihan kapasitas. Dari energi, China sedang mendorong transformasi struktur energi terbarukan, yang diharapkan dapat menurunkan biaya energi lebih jauh. Secara menengah, harga bergantung pada peningkatan kemampuan model dasar—setiap iterasi baru setiap tiga bulan biasanya dapat menyelesaikan kebutuhan yang sebelumnya tidak terpenuhi, melepaskan permintaan baru, dan mendorong harga daya komputasi naik; secara jangka panjang, bergantung pada evolusi kemampuan inferensi, yang akhirnya akan menurunkan biaya daya komputasi secara berkelanjutan.

Dalam dua tahun terakhir, pasokan dan permintaan bergantian bangkit. Tian Feng menyatakan bahwa DeepSeek adalah puncak inovasi dalam menurunkan biaya, dan ledakan produktivitas yang diwakili oleh “Lobster” menciptakan puncak permintaan. “Namun, ini tidak berarti bahwa saat permintaan melonjak, biaya inferensi tidak akan turun, hanya saja kecepatan ledakannya lebih tinggi daripada penurunan biaya inferensi. Dalam 3-5 tahun ke depan, total biaya daya dan Token akan menurun secara drastis.”

Yao Xin menyatakan bahwa AI telah memasuki “titik singularitas”, “menuju ke periode pertumbuhan pesat sepuluh kali lipat dan seratus kali lipat dalam satu atau dua tahun ke depan, semua industri yang tidak siap menghadapi pertumbuhan ini akan mengalami kekurangan pasokan dalam jangka pendek. Tapi seperti riak air, akhirnya akan menjadi stabil.”

Di balik kenaikan harga Token, logika bisnis juga berubah. CEO Nvidia Jensen Huang pernah menyebut struktur “lima lapis kue” AI, yang dibagi dari bawah ke atas menjadi energi, chip, infrastruktur, model, dan aplikasi, dengan lapisan teratas sebagai bagian yang akan memberikan keuntungan ekonomi terbesar.

“AI saat ini seperti pemandangan era internet tahun 2000, saat itu juga banyak yang tidak tahu apa yang bisa dilakukan internet, tetapi banyak orang terjun ke pembangunan berbagai situs web.” Huang Shilong mengatakan, dengan terus berkembang dan berinovasi, pada tahun 2005 dan 2006, berbagai aplikasi ‘Internet +’ muncul, dan berbagai layanan mulai menyatu. Perkembangan AI juga layak dinantikan, seperti yang diprediksi secara luas, tahun 2026 akan menjadi tahun pertama agen cerdas, dan tahun ini akan muncul berbagai aplikasi agen cerdas.

Aplikasi agen ini mulai menyatu ke ponsel, komputer, bahkan jalur produksi pabrik. “Setiap orang hampir tak terbatas dalam kebutuhan meningkatkan produktivitas melalui AI, satu-satunya batasan adalah harga. Jika harga naik, permintaan turun; jika harga turun, permintaan naik,” kata Tian Feng. Bahkan saat ini, perusahaan besar tidak selalu menaikkan harga secara “sama rata”. “Perusahaan besar menaikkan harga cloud untuk B-end (perusahaan), dan di sisi lain, mereka menawarkan uji coba gratis terbatas waktu atau kuota Token gratis untuk agen cerdas mereka agar merebut pasar C-end (konsumen).” Tian Feng mengakui bahwa situasi saat ini mirip dengan awal era internet, di mana perusahaan besar bersaing merebut pengguna, tetapi yang lebih penting adalah merebut pengembang.

Dulu, pengembang adalah programmer di seluruh dunia, sekarang banyak non-teknisi yang memiliki kemampuan Vibe Coding (pemrograman suasana). Mereka adalah konsumen dan pencipta kode. Perusahaan besar mengikat pengembang agar hasil pengembangan tetap berada di cloud mereka.

Perusahaan besar internet menyediakan kuota Token kepada karyawan, mendorong penggunaan AI. Menurut laporan Ji Mian News, Alibaba Group sedang mendorong rencana internal untuk memberi kuota Token kepada karyawan, mendorong mereka menggunakan model dan alat AI canggih dalam pekerjaan. Karyawan Alibaba dapat menggunakan gratis platform pemrograman agen cerdas seperti Wukong dan Qoder, serta alat AI berbayar lainnya untuk riset teknologi dan pekerjaan umum, dan perusahaan akan menyediakan kuota Token. Karyawan yang membeli anggota Coding Plan Balian atau alat pengembangan AI eksternal dapat mengajukan penggantian biaya.

Situasi penggunaan AI untuk meningkatkan efisiensi tidak terbatas pada pemrograman, tetapi juga meliputi penciptaan konten dan pekerjaan profesional lainnya yang membutuhkan Token. MiniMax bahkan mengupgrade Coding Plan menjadi Token Plan yang mendukung model multimodal MiniMax, menangkap peluang Token.

“Sejujurnya, dalam pembuatan model, belum ditemukan kebutuhan mendesak yang sangat besar, sehingga umumnya menggunakan model berlangganan bulanan. Token menarik perhatian karena indikator seperti jumlah pengguna bulanan dan konsumsi Token per orang langsung mewakili pertumbuhan pendapatan,” kata Tian Feng. Ini menciptakan ketergantungan pengguna yang sangat tinggi, selama produk cukup bagus, meskipun harganya sedikit lebih tinggi, pengguna tetap bersedia membayar untuk pengalaman yang lebih baik. Apalagi, dengan jumlah Token yang sama, bisa dijual seharga 22 yuan atau 400 yuan, dan selisih harga langsung terkait dengan kemampuan model dasar dan agen cerdas. Tian Feng menyatakan bahwa pada dasarnya, di balik Token adalah sebuah tambang emas yang belum sepenuhnya dieksploitasi.

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

Hadiah
suka
Komentar
Posting ulang
Bagikan

Komentar

Tambahkan komentar

Tidak ada komentar

Topik Trending
Lihat Lebih Banyak
#
Gate13thAnniversaryLive
1.27M Popularitas
#
WCTCTradingChallengeShare8MUSDT
831.84K Popularitas
#
IsraelStrikesIranBTCPlunges
30.82K Popularitas
#
CryptoMarketSeesVolatility
201.65K Popularitas
#
rsETHAttackUpdate
76.7K Popularitas

Sematkan

peta situs

Dari penurunan harga kolektif ke kenaikan harga kolektif, mengapa "Ekonomi Token" mengalami perubahan arah angin secara mendadak dalam dua tahun

Topik Trending

Gate13thAnniversaryLive

WCTCTradingChallengeShare8MUSDT

IsraelStrikesIranBTCPlunges

CryptoMarketSeesVolatility

rsETHAttackUpdate

Sematkan