Berapa banyak biaya langganan yang kamu bayarkan kepada Claude yang bisa didapatkan oleh perusahaan modul optik?

TL;DR

· Diagram pembagian biaya langganan Claude 20 USD, memecah biaya bulanan AI menjadi perusahaan model, cloud computing, GPU, listrik, dan rantai pasokan.

· Langganan AI memiliki biaya inferensi berkelanjutan, tidak bisa langsung menerapkan asumsi margin tinggi dari SaaS tradisional.

· Saham terkait: OpenAI, Anthropic, Microsoft, Amazon, Google, Nvidia (NVDA), TSMC, SK Hynix, Samsung, Micron, pusat data dan rantai listrik.

Sebuah diagram yang memperkirakan pembagian biaya sekitar 20 USD per bulan untuk Claude Pro di AS, memecah biaya ke perusahaan model, cloud computing, depresiasi GPU, listrik, dan rantai pasokan, sedang membuat investor kembali mempertanyakan bagaimana seharusnya valuasi pendapatan aplikasi AI.

Diagram ini bukan data pembagian pendapatan resmi dari Anthropic, cloud Amazon, atau Nvidia, juga bukan buku besar nyata dari perusahaan manapun. Nilainya terletak pada mengajukan pertanyaan mendasar: berapa banyak dari biaya langganan yang dibayar pengguna ke aplikasi AI bisa seperti margin software tradisional yang mengendap?

Valuasi SaaS tradisional cukup jelas. Setelah software selesai dibuat, menjual satu akun lagi biasanya biaya tambahan tidak tinggi, dan perusahaan software murni yang matang biasanya memiliki margin laba kotor 70% bahkan 80% lebih. Investor bersedia memberi multiple tinggi karena setelah skala pendapatan membesar, margin keuntungan berpotensi terus meningkat.

Masalahnya, aplikasi AI setiap kali pengguna bertanya, menulis kode, menganalisis file, atau memanggil agen, di baliknya harus mengonsumsi waktu GPU, listrik, bandwidth memori, dan sumber daya cloud. Secara permukaan adalah biaya bulanan tetap, tetapi secara dasar adalah rantai biaya yang berubah sesuai volume penggunaan. Pengguna ringan mungkin memiliki margin tinggi, sedangkan pengguna berat yang terus menjalankan tugas dalam kuota atau paket alat terkait, biayanya bisa melonjak dengan cepat.

Jadi, diagram pembagian biaya 20 USD ini menantang bukan berapa dolar yang diambil oleh perusahaan tertentu, tetapi apakah "pendapatan aplikasi AI secara alami sama dengan pendapatan SaaS". Perusahaan AI harus membuktikan bahwa mereka layak mendapatkan multiple tinggi, bukan hanya bahwa pengguna bersedia membayar, tetapi juga bahwa margin laba bersih berbobot volume penggunaan bisa terus membaik.

Ada rantai biaya inferensi di balik biaya langganan

Perbedaan terbesar antara langganan AI dan perangkat lunak biasa adalah "biaya marginal sekali pakai" tidak lagi mendekati nol.

Dalam SaaS tradisional, satu tim bisa membuka lebih banyak akun, dan penyedia layanan juga punya biaya server, layanan pelanggan, dan bandwidth, tetapi biaya ini biasanya tidak meningkat secara linier dengan setiap klik. Yang benar-benar mahal adalah pengembangan awal, penjualan, dan akuisisi pelanggan. Setelah produk skala, sebagian pendapatan tambahan bisa tetap di perusahaan.

Produk model besar berbeda. Saat pengguna memasukkan pertanyaan, model menghasilkan jawaban, proses ini disebut inferensi, yaitu perhitungan nyata saat model dipanggil pengguna. Token adalah satuan dasar pengukuran teks yang dibaca dan tulis oleh model. Semakin banyak pertanyaan, semakin panjang konteks, dan semakin kompleks konten yang dihasilkan, semakin banyak token dan daya komputasi yang dikonsumsi.

Ini menciptakan konflik antara biaya tetap langganan dan biaya variabel. Claude Pro di AS sekitar 20 USD per bulan, harga ini dipengaruhi oleh wilayah, pajak, dan penyesuaian Anthropic. Pengguna melihat harga tetap, tetapi perusahaan model menghadapi perilaku penggunaan yang sangat berbeda. Ada yang hanya mengirim email dan mencari info, ada yang memproses dokumen panjang, menjalankan kode, atau memanggil otomatisasi yang lebih kompleks.

Diagram pembagian yang beredar mencoba memvisualisasikan hal ini: dari 20 USD, sebagian masuk ke perusahaan model, sebagian lagi dibayar ke penyedia cloud dan komputasi. Biaya komputasi termasuk listrik, pemeliharaan, depresiasi GPU. Pembelian GPU kemudian mengalir ke Nvidia, TSMC, vendor HBM (memori bandwidth tinggi), modul optik, ODM, dan perusahaan terkait listrik.

"Depresiasi GPU" di sini bisa dipahami sebagai GPU yang mahal bukan dihitung selesai sekali, tetapi dialokasikan secara perlahan ke biaya layanan AI berdasarkan umur pakai, intensitas penggunaan, atau metode akuntansi. Distribusi nyata dipengaruhi oleh batas paket, proporsi pengguna ringan dan berat, harga internal cloud, diskon cadangan daya, utilisasi GPU, dan umur depresiasi. Rata-rata biaya ini tidak sama dengan biaya marginal.

Investor perlu fokus pada arah: perusahaan aplikasi AI tidak cukup hanya mengungkapkan pertumbuhan pendapatan, tetapi juga harus menjawab apakah biaya komputasi di balik pertumbuhan pendapatan juga meningkat secara seimbang. Jika volume penggunaan berkembang lebih cepat dari peningkatan efisiensi model, pendapatan langganan yang lebih tinggi bisa menekan margin laba. Hanya jika efisiensi meningkat cukup cepat, perusahaan model punya peluang mendekati struktur keuntungan perusahaan perangkat lunak.

Infrastruktur mendapatkan pendapatan yang lebih pasti terlebih dahulu

Saat ini, pertumbuhan volume penggunaan AI lebih langsung mengalir ke infrastruktur, bukan seluruhnya tersimpan di lapisan aplikasi.

Tidak peduli pengguna memakai Claude, ChatGPT, Gemini, atau agen internal perusahaan, inferensi akhirnya bergantung pada komputasi, listrik, memori, dan jaringan. Lapisan aplikasi mungkin berganti produk, tetapi sumber daya dasar cenderung lebih kaku. Selama penggunaan AI terus meningkat, pengeluaran cloud, pembelian GPU, permintaan HBM, dan konsumsi listrik pusat data akan terdorong naik.

Ini juga alasan mengapa Nvidia, TSMC, SK Hynix, dan rantai infrastruktur lainnya terus dinilai ulang oleh pasar. Margin laba Nvidia secara keseluruhan berada di level tinggi, dengan margin GAAP dan non-GAAP sekitar 71.1% dan 71.3% di FY2026, dan panduan kuartal berikutnya tetap tinggi. Perlu diingat, beberapa kuartal bisa terganggu oleh biaya tertentu, dan laporan keuangan tidak selalu secara langsung memisahkan margin laba pusat data AI, tetapi kekurangan infrastruktur yang langka sudah tercermin dalam kinerja.

HBM adalah bagian paling khas dari rantai ini. Bukan memori biasa, tetapi komponen kunci untuk akselerator AI yang mendukung komputasi throughput tinggi. Setelah skala model, panjang konteks, dan kebutuhan inferensi paralel meningkat, ketergantungan chip AI pada memori bandwidth tinggi semakin besar. Estimasi rantai pasok menunjukkan proporsi HBM dalam biaya chip AI generasi baru meningkat, menjadi salah satu alasan harga kembali menyesuaikan SK Hynix, Samsung, dan Micron selama siklus AI.

Listrik dan pusat data juga beralih dari biaya latar belakang menjadi fokus investasi utama. Konsumsi energi untuk query teks biasa mungkin tidak besar, tetapi agent kompleks, konteks panjang, pembuatan kode, dan tugas multi-putar akan memperbesar kebutuhan komputasi. Bagi penyedia cloud dan operator pusat data, yang penting bukan berapa listrik yang dipakai satu query, tetapi saat permintaan inferensi masif terus berlangsung, utilisasi kluster, harga listrik, pendinginan, kapasitas server, dan koneksi ke jaringan listrik menjadi faktor biaya dan hambatan.

Kelebihan infrastruktur terletak pada verifikasi kinerja yang lebih cepat. Pengeluaran modal cloud untuk AI sudah terjadi, pendapatan dan margin Nvidia tercermin di laporan keuangan, pesanan dan harga HBM juga akan segera masuk ke laporan laba rugi. Lebih banyak transaksi di lapisan aplikasi model adalah tentang ekspektasi masa depan: konversi langganan, penetrasi perusahaan, pendapatan API, dan pelepasan margin dari penurunan biaya di masa depan.

Perbaikan efisiensi tetap menjadi dasar utama bagi bullish

Investor perangkat lunak dan AI tidak tanpa argumen balasan. Inti dari pandangan optimis efisiensi adalah bahwa biaya inferensi yang tinggi saat ini hanyalah fenomena awal, dan optimisasi model, caching, model kecil, chip buatan sendiri, serta pemanfaatan kluster yang lebih tinggi akan terus menekan biaya per unit. Jika biaya turun cukup cepat, aplikasi AI masih bisa kembali ke logika margin tinggi seperti SaaS.

Argumen ini memiliki dasar nyata. Beberapa model utama sudah menunjukkan penurunan biaya token secara signifikan dengan kemampuan yang setara atau lebih tinggi. OpenAI pernah mengungkapkan bahwa biaya token GPT-4o mini turun 99% dibandingkan text-davinci-003 awal. Kecepatan di berbagai perusahaan tidak sama, Anthropic baru-baru ini lebih menonjolkan peningkatan harga yang sama dan stratifikasi model, tetapi arah industri tetap menuju penyediaan kemampuan lebih kuat dengan biaya lebih rendah.

Perusahaan model juga punya berbagai cara untuk meningkatkan ekonomi per unit. Menyerahkan tugas sederhana ke model kecil, menggunakan cache untuk reuse permintaan umum, dan menugaskan model yang lebih kuat untuk konteks panjang dan tugas kompleks. Penyedia cloud mengurangi biaya per unit komputasi melalui chip buatan sendiri dan penjadwalan kluster. Google punya TPU, Microsoft meluncurkan Maia untuk inferensi, dan Amazon juga mengembangkan Trainium dan Inferentia.

Jika hanya melihat kemajuan teknologi, margin keuntungan aplikasi AI memang punya ruang untuk membaik. Inferensi yang lebih murah, routing model yang lebih baik, kemampuan kompresi yang lebih kuat, semuanya memungkinkan langganan 20 USD yang sama menampung volume penggunaan lebih banyak. Pengguna ringan, paket perusahaan berharga tinggi, penetapan harga API berlapis, dan batasan penggunaan yang lebih ketat juga bisa memperbaiki ekonomi per unit secara keseluruhan.

Tantangannya adalah, penurunan biaya bukan satu-satunya variabel. Aplikasi AI sedang beralih dari sekadar chat sederhana ke beban kerja yang lebih berat. Dulu pengguna mungkin hanya melakukan Q&A dan mengedit teks, sekarang semakin banyak permintaan berasal dari agen kode, pengolahan dokumen panjang, video, generasi multimodal, dan otomatisasi perusahaan. Skema ini bernilai lebih tinggi dan konsumsi juga lebih besar. Semakin berguna model, semakin besar kemungkinan pengguna menyerahkan tugas yang lebih kompleks dan panjang.

Perbedaan menjadi lebih spesifik: kecepatan penurunan biaya inferensi, apakah bisa mengungguli pertumbuhan volume dan kompleksitas tugas. Jika biaya per unit turun sangat cepat tetapi konsumsi rata-rata pengguna meningkat lebih cepat, margin tertimbang perusahaan model tetap akan tertekan. Sebaliknya, jika routing model, caching, chip buatan sendiri, dan stratifikasi harga cukup efektif, langganan AI bisa secara bertahap mengurangi karakter biaya tinggi saat ini.

Jumlah pengguna langganan bukanlah margin laba

Diagram pembagian biaya 20 USD ini bukanlah akhir dari segalanya. Lebih sebagai pengingat valuasi saat ini: ketika pasar belum cukup transparan tentang margin laba perusahaan model, investor perlu memberi diskon pada asumsi "Aplikasi AI secara alami sama dengan SaaS".

Bagi perusahaan model yang belum go public seperti OpenAI dan Anthropic, sulit bagi investor eksternal melihat buku besar lengkap. Data pendanaan, pengungkapan mitra, struktur biaya cloud, harga paket perusahaan, proporsi pendapatan API, dan batasan penggunaan semuanya menjadi petunjuk. Data yang paling berharga bukan jumlah pengguna berbayar, tetapi proporsi pengguna ringan dan berat, apakah perusahaan bersedia membayar lebih untuk penggunaan intensif, biaya cloud yang menurun, dan apakah biaya inferensi per unit bisa menekan margin perusahaan.

Verifikasi dari perusahaan yang sudah listed akan lebih cepat muncul di laporan keuangan. Margin laba Nvidia secara keseluruhan dan pertumbuhan pendapatan pusat data, kebutuhan proses canggih TSMC, harga dan margin HBM, serta intensitas pengeluaran modal cloud akan terus mencerminkan apakah penggunaan AI masih mengalir ke infrastruktur. Jika indikator ini tetap kuat dan tidak ada bukti margin laba lapisan aplikasi membaik, pasar akan tetap memberi valuasi premium yang lebih pasti pada infrastruktur.

Akhirnya, perusahaan model harus membuktikan bukan hanya bahwa pengguna bersedia membayar 20 USD, tetapi bahwa setelah penggunaan berat, margin yang tersisa cukup besar. Perbedaan harga berikutnya kemungkinan tidak lagi di angka ARR utama, tetapi di biaya inferensi, batas paket, dan apakah harga perusahaan untuk enterprise bisa berjalan bersamaan.

Klik untuk mengetahui posisi lowongan di律动BlockBeats

Selamat bergabung dengan komunitas resmi律动BlockBeats:

Telegram Grup Berlangganan: https://t.me/theblockbeats

Telegram Grup Diskusi: https://t.me/BlockBeats_App

Akun resmi Twitter: https://twitter.com/BlockBeatsAsia

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan