Di balik lonjakan sebesar 31.8%, apakah penjualan API oleh Zhipu sudah berjalan lancar?

文/阿奇

Kemarin, Zhipu merilis kinerja sepanjang tahun 2025, yang juga merupakan laporan keuangan pertamanya sejak go public.

Sepanjang tahun, pendapatan mencapai 724 juta yuan, naik 131,9%; namun dengan dorongan belanja penelitian dan pengembangan sebesar 3,18 miliar yuan, kerugian bersih setelah penyesuaian mencapai 3.18B yuan.

Meski rugi sebesar itu, respons pasar justru sangat positif. Hari ini, harga saham Zhipu naik 31,8%.

Salah satu alasan yang sangat penting adalah, bisnis menjual API itu terlihat seperti sudah berjalan.

Pada tahun 2025, pendapatan dari penjualan API meningkat dari 48M yuan pada 2024 menjadi 190M yuan, naik 296%. Pada saat yang sama, dalam konferensi telepon, manajemen Zhipu secara tegas menyebutkan bahwa ARR layanan API saat ini sekitar 250 juta dolar AS, dan diperkirakan bisa mencapai 1 miliar dolar AS pada akhir tahun.

Yang lebih penting, ini bukan kasus yang terisolasi. Di perusahaan-perusahaan model besar lainnya, kita juga mulai melihat tren serupa: volume pemanggilan Token sedang meningkat, dan API sedang menjadi salah satu jalur monetisasi yang paling langsung.

Lalu, bagaimana seharusnya kita memandang fenomena ini? Hari ini kita akan membahasnya dengan mengaitkan pada laporan keuangan Zhipu.

/ 01 /

Pertumbuhan fondasi model, bertumpu pada penjualan API

Dalam laporan keuangan Zhipu ini, perubahan yang paling layak diperhatikan adalah perpindahan struktur pendapatan.

Penerapan di cloud telah menjadi sumber pertumbuhan yang paling inti. Yang dimaksud penerapan di cloud pada dasarnya adalah layanan API. Pada tahun 2025, pendapatan dari bagian ini meningkat dari 48M yuan pada 2024 menjadi 1,9 miliar yuan, naik 296%; pangsa pendapatannya juga naik dari 15,5% menjadi 26,3%.

Inti logika pertumbuhan API adalah pertumbuhan volume pemanggilan.

Dan di balik itu, tidak terlepas dari dorongan OpenClaw. Ketika Agent mulai mengeksekusi tugas secara otomatis, satu kebutuhan biasanya berpadanan dengan banyak putaran pemanggilan; konsumsi Token pun menjadi berlipat, sehingga volume pemanggilan API ikut meningkat.

Dari balik inilah secara bertahap terbentuk konsensus industri: ketika model besar memiliki kemampuan mengeksekusi tugas jarak jauh, pemanggilan tidak lagi berhenti pada proses input-output satu kali, melainkan berevolusi menjadi proses sistematis yang dapat berjalan secara berkelanjutan.

Dalam struktur seperti ini, Token itu sendiri menjadi unit penagihan yang paling langsung—dan juga paling pasti.

Dengan kata lain, ketika kemampuan model cukup kuat, API itu sendiri akan mengerucut menjadi model bisnis yang paling jelas bagi model besar.

Tren ini sedang menjadi pilihan bersama para vendor model besar.

Luar negeri sudah bergerak lebih awal. Sekitar 80% pendapatan Anthropic berasal dari layanan pemanggilan API tingkat perusahaan; pada dasarnya itu adalah sistem penagihan yang berpusat pada konsumsi Token.

Di dalam negeri juga dengan cepat mendekati struktur ini.

Saat ini, pada perusahaan model dasar arus utama di dalam negeri, seperti Zhipu AI, MiniMax, dan inti pendapatan dari Moonshot (Masa Gelap Bulan), pendapatan mereka secara bertahap mengerucut pada pemanggilan API; MaaS (Model as a Service) menjadi jalur utama untuk menopang pertumbuhan.

Manajemen Zhipu secara tegas menyebutkan dalam konferensi telepon bahwa ARR layanan API saat ini sekitar 250 juta dolar AS, dan diperkirakan bisa mencapai 1 miliar dolar AS pada akhir tahun. Ke depan, perusahaan juga akan lebih menitikberatkan pada layanan API yang distandarisasi. Pada tahun 2026, layanan API dan penerapan lokal diperkirakan masing-masing akan menyumbang separuh; setelah itu, dalam 2–3 tahun berikutnya, fokus akan makin miring ke API.

Perubahan serupa juga sedang terjadi pada MiniMax.

Pada tahun 2025, pendapatan dari platform terbuka dan layanan perusahaan mencapai 190M dolar AS, naik 197,8%; pangsa pendapatannya naik dari 28,6% menjadi 32,8%.

Hingga Februari 2026, ARR perusahaan sudah menembus 150 juta dolar AS; dibandingkan 79 juta dolar AS pada tahun fiskal 2025, pertumbuhannya menjadi dua kali lipat. Pendorong utama pertumbuhan itu juga berasal dari peningkatan konsumsi Token, terutama dari meluasnya skenario asisten pengodean dan agen (Agent).

Goldman Sachs memperkirakan bahwa pada tahun 2026, pangsa pendapatan MiniMax dari platform terbuka (API) akan mencapai sekitar 40%.

Pengkerucutan model bisnis model besar berarti cara mengukur nilai pun menjadi lebih jelas: dari “indikator kemampuan”, beralih ke “pengukuran Token”.

/ 02 /

Di balik diferensiasi jalur, ada dua cara menyelesaikan masalah

Seiring AI memasuki fase aplikasi, satu masalah mulai menjadi lebih spesifik: ketika kemampuan model besar secara bertahap mengerucut, apa sebenarnya kompetensi inti model besar?

Terkait pertanyaan ini, Zhipu dan MiniMax memberikan dua jawaban yang berbeda.

Logika Zhipu adalah mengejar batas atas model yang ekstrem.

Zhang Peng mengajukan konsep TAC (Token Architecture Capability, kemampuan arsitektur Token). Pada dasarnya konsep ini bisa diuraikan menjadi tiga poin: skala pemanggilan, kualitas pemanggilan, dan kemampuan untuk mengubahnya menjadi pendapatan.

Penilaian intinya adalah: kualitas yang cerdas menentukan hak penetapan harga.

Penilaian Zhipu adalah: “Seiring evolusi Agent, Token akan berlapis: token berkompleksitas rendah dan terstandarisasi akan bergerak menuju harga rendah bahkan gratis; hanya token berkualitas tinggi dengan kompleksitas tinggi dan keandalan tinggi yang memiliki hak penetapan harga yang berkelanjutan.”

Hal ini sudah tercermin pada data. Pada kuartal pertama, harga API Zhipu naik 83%, tetapi permintaan tidak menyusut; sebaliknya, terjadi kondisi kekurangan, dan volume pemanggilan meningkat hingga 400%.

Jika Zhipu AI berbicara tentang “kualitas menentukan hak penetapan harga”, maka MiniMax sebenarnya berbicara dengan logika lain: daya saing model berasal dari “diferensiasi jalur” dan “efisiensi”.

MiniMax memilih jalur yang tidak arus utama—pengembangan mandiri multimodal dengan empat modalitas besar berjalan paralel: teks, video, suara, dan musik. Ini tidak umum di kalangan vendor model besar saat ini.

Inti jalur ini bukan pada “banyaknya” hal, melainkan pada “jangkauan yang luas”.

Menurut Yan Junjie, nilai perusahaan platform di era AI pada dasarnya adalah: kepadatan kecerdasan × throughput Token.

Makna multimodal adalah memperbesar throughput Token tanpa secara signifikan menurunkan kepadatan kecerdasan. Karena yang diubah bukan batas atas kemampuan, melainkan ambang penggunaan.

Ketika produk menambahkan cara interaksi seperti gambar dan suara, biaya pemahaman pengguna dan ambang operasinya akan turun secara jelas; basis pengguna juga akan meluas ke lebih banyak kelompok, termasuk orang tua, anak-anak, dan kelompok lain yang sebelumnya sulit dijangkau.

Hal ini sebenarnya sudah terjadi sekali di internet seluler—dari arus informasi berbasis gambar dan teks, hingga meledaknya short video. Pada dasarnya semuanya adalah lompatan penetrasi yang didapat lewat penurunan ambang interaksi.

Lihat lagi efisiensi. Jalur utama lain MiniMax adalah efisiensi pemanfaatan sumber daya yang ekstrem.

Pada tahun 2025, perusahaan membelanjakan 253 juta dolar AS untuk R&D, naik 33,8%; ini jauh lebih rendah daripada laju pertumbuhan pendapatan 158,9%.

Sebagai perbandingan, strategi Zhipu AI lebih dekat ke “berani mengangkat tinggi dan memukul keras”.

Pada tahun 2025, pendapatan Zhipu adalah 724 juta yuan, yang setara dengan biaya R&D sebesar 3,18 miliar yuan; rasio biaya R&D mencapai 439%. Pada periode yang sama, pendapatan MiniMax adalah 540 juta yuan, biaya R&D 25.96M yuan; rasio biaya R&D sebesar 323%.

Dari sisi efisiensi operasional, untuk setiap 1 yuan pendapatan yang diperoleh Zhipu, terkait kerugian sekitar 4,4 yuan; MiniMax sebesar 3,2 yuan. Dari sisi efisiensi personel, Zhipu sekitar 660 ribu yuan; MiniMax mencapai 1,26 juta.

Tentu, di sini ada sebagian perbedaan yang berasal dari model bisnis. MiniMax lebih bergantung pada pendapatan produk, sementara Zhipu masih didominasi oleh penerapan lokal.

Namun meskipun begitu, diferensiasi dua jalur ini tetap jelas:

Satu sisi mengejar “batas atas kecerdasan”, memperoleh hak penetapan harga melalui peningkatan kemampuan;

Sisi lainnya mengoptimalkan “efisiensi dan cakupan”, memperbesar skala penggunaan untuk meningkatkan throughput Token.

Pada dasarnya, ini adalah dua solusi yang sepenuhnya berbeda di bawah rumus yang sama.

/ 03 /

Struktur oligopoli—itulah kepastian terbesar dari bisnis model dasar

Mengabaikan penilaian nilai (valuation), bisnis vendor model masih mulai menunjukkan garis besar yang relatif jelas.

Bisnis model dasar ini tidak seperti perangkat lunak tradisional.

Perangkat lunak tradisional biasanya membutuhkan investasi besar di awal, lalu pemulihan perlahan di tahap akhir; tetapi model dasar berbeda. Biayanya naik secara bertahap seperti tangga, sedangkan pendapatan belum tentu ikut menjadi lebih tebal; bahkan bisa terus tertekan ketika persaingan makin sengit.

Dari sudut pandang ini, ia lebih mirip struktur yang “secara bawaan agak rapuh”. Namun menariknya, struktur seperti ini justru mengarah pada hasil yang lain:

Ia secara alami akan menuju oligopoli.

Karena hanya sedikit perusahaan yang mampu terus menanggung tingkat investasi seperti itu. Dari bentuk bisnisnya, ia lebih mirip baterai atau pabrik wafer: investasi awal sangat besar, tetapi begitu posisi berhasil direbut, jumlah pesaing sedikit, dan kue pasar cukup besar.

Pada saat yang sama, model besar memiliki satu hal yang lebih halus: ia tidak sepenuhnya pasar “winner-takes-all”, melainkan lebih mirip pasar berlapis.

Model paling atas, bahkan jika hanya memiliki keunggulan efektivitas 5%, dalam skenario rumit yang berorientasi efisiensi seperti coding, keunggulan itu akan diperbesar menjadi premi lebih dari 50%—sebuah efek pengganda yang ditentukan oleh multiplier effect.

Namun di sisi lain, tidak semua tugas membutuhkan model terkuat.

Akibatnya, pasar akan tersegmentasi secara alami: lapisan teratas mengambil premi, lapisan tengah mengejar skala, dan lapisan terbawah menampung kebutuhan ekor panjang (long tail). Bahkan, antar lapisan bisa terbentuk semacam “aliran Token”—tugas kompleks bergerak ke atas, tugas sederhana bergerak ke bawah.

Bahkan jika kamu tidak bisa mencapai SOTA secara global, tetapi berhasil mencapai SOTA di suatu bidang spesifik, jalur itu tetap bisa berhasil.

Dalam struktur seperti ini, efisiensi juga merupakan variabel yang sangat penting.

Karena industri ini hampir tidak memiliki efek jaringan, biaya pindah pengguna sangat rendah. Ini berarti, selama ada perusahaan yang bisa membuat model “90 poin” dengan harga lebih rendah, mereka bisa dengan cepat memperluas volume.

Dalam proses ini, efisiensi pun menjadi variabel penting dalam proses komersialisasi.

Karena tidak ada efek jaringan dan biaya perpindahan rendah, selama ada perusahaan yang bisa membuat model “90 poin” dan sekaligus harga lebih rendah, mereka juga bisa cepat memperbesar volume.

Alasannya sangat langsung: di sebagian skenario, tidak diperlukan model paling kuat. Ketika kesenjangan performa terbatas, harga menjadi faktor penentu.

Dan di balik harga, pada dasarnya adalah biaya. Ini tidak hanya bergantung pada teknologi, melainkan juga perbedaan biaya serangkaian hal seperti komputasi (compute) dan listrik.

Sebagai contoh di Tiongkok: melalui optimasi rekayasa, penerapan berskala besar, serta biaya listrik yang lebih rendah, biaya inferensi bisa ditekan secara signifikan. Hal ini membuat model dengan kemampuan setara bisa menyediakan layanan Token dengan harga yang lebih rendah kepada pihak luar.

Sekarang sebagian vendor model Tiongkok yang melakukan ekspansi ke luar negeri, pada dasarnya sedang menjalankan bisnis “selisih harga Token”.

Meski pertumbuhan pendapatan berasal dari permintaan yang meledak-ledak dan struktur pasar oligopoli, hal ini juga tidak boleh terlalu optimistis; karena perbedaan lingkungan kompetisi, Tiongkok dan AS dalam menjual API masih memiliki banyak perbedaan:

Misalnya, ekosistem model besar di AS lebih bergantung pada kebutuhan long tail dari developer. Klien perusahaan dan developer lebih bersedia membayar kemampuan; performa model lebih mudah dikonversi secara langsung menjadi premi.

Sedangkan pemanggilan di dalam negeri lebih terkonsentrasi pada klien papan atas, termasuk platform internet dan klien pemerintah dan perusahaan (政企). Ditambah lagi dengan persaingan di sisi pasokan, premi Token kemungkinan besar tidak akan bertahan dalam jangka panjang.

Dalam batas tertentu, bisa dikatakan bahwa di AS, model dasar lebih mendekati gabungan perangkat lunak dan platform, sedangkan di Tiongkok lebih mirip bagian dari infrastruktur.

Dari sudut pandang ini, sejauh mana model bisnis perusahaan model besar di dalam negeri bisa berjalan, mungkin masih perlu dilihat lagi.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan