Penggunaan Token Meningkat 10 Kali Lipat Setahun, Tidak Heran Produsen Menaikkan Harga

robot
Pembuatan abstrak sedang berlangsung

Didorong oleh ledakan permintaan AI global, kekurangan sumber daya komputasi, dan kenaikan biaya perangkat keras, produsen model besar dan penyedia layanan cloud secara kolektif menaikkan harga baru-baru ini.

Pada 11 Maret, Tencent Cloud menjadi yang pertama menyesuaikan strategi penagihan, harga input model seri Hunyuan Tencent HY2.0 Instruct naik dari 0,0008 yuan/seribu token menjadi 0,004505 yuan/seribu token, kenaikan sebesar 463%; sekaligus menghentikan uji coba gratis model pihak ketiga seperti GLM 5 dan MiniMax, dan beralih ke penggunaan komersial resmi.

Pada 16 Maret, Zhipu meluncurkan model baru GLM-5-Turbo dan menaikkan harga API sebesar 20%, dengan kenaikan rata-rata 83% dibandingkan generasi sebelumnya GLM-4.7.

Pada 18 Maret, Alibaba Cloud dan Baidu Smart Cloud mengumumkan kenaikan harga pada hari yang sama. Menurut pengumuman resmi, Alibaba Cloud akan menyesuaikan harga layanan terkait kartu komputasi seperti PinTouGe ZhenWu 810E dan layanan CPFS (versi kecerdasan), dengan kenaikan tertinggi mencapai 34%; Baidu Smart Cloud secara tegas menyatakan bahwa harga produk dan layanan terkait AI computing power akan naik sekitar 5%—30%, dan harga penyimpanan file paralel sekitar 30%. Kedua penyedia cloud tersebut menyalahkan kenaikan harga ini pada “ledakan permintaan AI global”.

Meskipun permintaan AI global secara keseluruhan sulit diperkirakan, data dari platform penggabungan API terbesar di dunia, OpenRouter, memberikan gambaran sekilas. Diketahui bahwa OpenRouter adalah platform API yang menggabungkan berbagai model kecerdasan buatan, di mana pengguna umum dan pengembang dapat mengakses berbagai model LLM melalui antarmuka yang sama untuk percakapan, seperti GPT-4, Claude, Gemini, Deepseek, dan lainnya.

Data yang diungkapkan oleh OpenRouter menunjukkan bahwa pada minggu yang berakhir 24 Maret 2025, jumlah token yang digunakan untuk memanggil model besar melalui platform ini adalah 1,62 triliun, dan pada minggu yang berakhir 9 Maret tahun ini, jumlah tersebut telah meningkat menjadi 16,90 triliun, sepuluh kali lipat dalam satu tahun. Terutama sejak 30 Januari tahun ini, saat OpenClaw (“Kepiting”) resmi dirilis, laju pertumbuhan penggunaan token semakin jelas. Pada minggu peluncurannya, penggunaan token di platform ini mencapai 8,25 triliun, dan hanya dalam lebih dari satu bulan, jumlah ini berlipat ganda menjadi 16,90 triliun.

Laporan riset Galaxy Securities menyatakan bahwa pada minggu pertama Maret 2026, volume proses platform mencapai 14,8 triliun token, dua kali lipat dari awal tahun, di mana alur kerja yang didorong oleh Agent telah menghasilkan lebih dari setengah total output platform.

Selain itu, berdasarkan data penggunaan token spesifik pada minggu 9 Maret, terdapat empat model besar domestik yang mendominasi. MiniMax M2.5 dengan 1,75 triliun menempati posisi pertama, Step 3.5 Flash (Stellar Leap) dan DeepSeek V3.2 dengan 1,34 triliun dan 1,04 triliun berada di posisi kedua dan ketiga, dan Kimi K2.5 dengan 0,56 triliun menempati posisi kesembilan. Selain itu, sejak minggu 9 Februari, ketika jumlah panggilan model China pertama kali melampaui AS, MiniMax M2.5 telah menduduki peringkat pertama selama lima minggu berturut-turut.

Meskipun OpenRouter hanya menghitung panggilan yang dilakukan melalui platform dan tidak termasuk pengguna yang langsung menggunakan API dari pabrik, sebagai platform penggabungan API terbesar di dunia, data ini tetap menunjukkan kekuatan dan permintaan besar terhadap model besar domestik.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan