Realitas perusahaan setelah surutnya demam Token: Pengendalian anggaran menjadi normal baru, tetapi kereta AI tidak melambat.

Era 'minum sepuasnya' dari konsumsi AI perusahaan akan segera berakhir, namun pengendalian tagihan tidak berarti menginjak rem.

Pada paruh pertama tahun ini, 'Maksimisasi Token' (Tokenmaxxing) menjadi istilah populer di kalangan AI perusahaan. Perusahaan seperti Meta dan Salesforce secara aktif mendorong karyawan untuk mengonsumsi sebanyak mungkin Token AI guna meningkatkan produktivitas. Di dalam Meta, bahkan muncul papan peringkat bernama 'Ekonomi Claude' (Claudeconomics) yang melacak 250 pengguna terberat perusahaan. Data menunjukkan bahwa karyawan Meta mengonsumsi lebih dari 60 triliun Token dalam 30 hari, dengan pengguna tertinggi mengonsumsi sekitar 280 miliar Token. Demi bersaing mendapatkan gelar seperti 'Legenda Token' dan 'Penyihir Cache', karyawan meminta agen AI menghabiskan waktu berjam-jam untuk melakukan penelitian yang tidak bermakna demi 'membakar Token'.

Selanjutnya, Uber menjadi berita utama karena menghabiskan anggaran tahunan Claude Code dan Codex dalam empat bulan, dan segera menerapkan batas penggunaan $1.500 per bulan bagi karyawan, dengan kelebihan yang harus disetujui per kasus.

Peristiwa-peristiwa ini menarik perhatian luas. Namun tim SemiAnalysis melakukan riset lapangan di Databricks AI Summit dan setelah diskusi mendalam dengan lebih dari 50 klien perusahaan melalui Slack dan telepon, mereka sampai pada kesimpulan yang sangat berbeda dari narasi media.

Lembaga tersebut berpendapat bahwa laporan media sangat membesar-besarkan universalitas masalah. Kasus ekstrem Meta dan Uber berakar pada insentif yang tidak tepat dan manajemen internal yang longgar, bukan karena investasi AI perusahaan secara keseluruhan di luar kendali.

Kisah utama dibesar-besarkan, data nyata lebih moderat

Laporan media mungkin membesar-besarkan krisis anggaran AI perusahaan.

Data kunci mendukung penilaian ini. SemiAnalysis mengutip data pengeluaran Ramp yang menunjukkan bahwa 1% klien teratas menghabiskan sekitar $90.000 per karyawan per tahun untuk AI, 10% teratas sekitar $7.300, sementara median klien Ramp hanya $136. Tingkat penerapan teknologi klien Ramp secara keseluruhan sudah jauh di atas rata-rata perusahaan, namun pengeluaran AI per kapita klien media Fortune 500 masih jauh di bawah $100.

Bahkan Meta, yang dianggap sebagai 'pembakar Token besar', menghabiskan hampir $50.000 per karyawan per tahun berdasarkan harga tercantum, namun menurut estimasi SemiAnalysis hanya menyumbang 3% hingga 5% dari pendapatan klien Anthropic.

Dokumentasi Anthropic sendiri juga membuktikan hal ini: pengembang Claude Code rata-rata menghabiskan hanya $150 hingga $250 per bulan, dan hanya 10% pengguna yang menghabiskan lebih dari $30 per hari.

SemiAnalysis berpendapat: 'Laporan yang dibesar-besarkan media tidak benar—perusahaan terus berinvestasi, konsumsi Token dari skenario permintaan baru dan vertikal mendorong kereta AI untuk terus melaju dengan kecepatan yang pesat.'

Ini berarti adopsi AI perusahaan masih dalam tahap difusi yang tidak merata. Tidak semua karyawan menggunakan model besar dengan frekuensi tinggi. Banyak perusahaan hanya beberapa tim dan posisi yang mulai berjalan lebih dulu.

Pengendalian anggaran menjadi norma baru, namun standar sangat beragam

Dari lebih dari 50 perusahaan yang disurvei, sebagian besar telah menetapkan batas keras pada penggunaan AI. Namun standar antar perusahaan sangat bervariasi dan tidak ada konsensus industri.

Kasus tingkat rendah:

  • Produsen kedirgantaraan dan pertahanan tiga besar AS: batas $250 per orang per bulan, beberapa pengguna berat menghabiskan kuota dalam empat hari pertama bulan pertama

  • Salah satu perusahaan farmasi terbesar di dunia: batas $500 per orang per bulan, dapat mengajukan $1.000 dalam kasus khusus

Kasus tingkat tinggi:

  • Workday, Stripe: anggaran bulanan per karyawan sekitar $2.000

  • Perusahaan keamanan siber publik: karyawan junior $800 per bulan, senior $1.600 hingga $4.000, ilmuwan data mendapat alokasi tertinggi

  • Perusahaan teknologi perjalanan besar (800 insinyur dari 1.500 karyawan, pengeluaran AI tahunan mendekati $10 juta): default $200 per orang per bulan, dapat meningkat hingga puluhan ribu dolar tergantung posisi

Logika penetapan anggaran juga berbeda. Salah satu dari tiga maskapai penerbangan terbesar AS memiliki pendekatan paling unik: alokasi Token langsung dikaitkan dengan proyek spesifik dan pendapatan yang diharapkan. Misalnya, untuk proyek dengan pendapatan yang diharapkan $10 juta, tim keuangan menyetujui anggaran total $1 juta, dan tim memutuskan sendiri berapa proporsi yang akan digunakan untuk Token—biaya AI dimasukkan ke dalam model keuangan proyek, bukan anggaran IT terpisah.

Aturan bertahan hidup 'Hemat Token' karyawan

Tekanan anggaran memaksa lahirnya serangkaian strategi penghematan Token yang praktis.

Yang paling khas adalah 'arbitrase Copilot': pengguna berlangganan Microsoft 365 perusahaan dapat menggunakan chatbot standar Copilot secara gratis tanpa batas, dan penggunaan itu tidak dihitung dalam anggaran AI bulanan. Perusahaan produk konsumen dan teknologi kesehatan besar asal Belanda dengan jelas menyatakan bahwa karyawan akan menggunakan Copilot terlebih dahulu untuk menyusun dan mengintegrasikan ide, lalu memanggil Claude atau Codex untuk menangani tugas akhir, sehingga menghemat Token yang terukur.

Penurunan model juga merupakan cara umum. Perusahaan teknologi perjalanan global itu telah mengganti model default Claude untuk semua karyawan dari Opus ke Sonnet, Opus masih dapat digunakan tetapi harus dipilih secara aktif. Produsen kedirgantaraan dan pertahanan itu langsung 'menonaktifkan' Opus 4.8 dan mode cepat.

Menanggapi hal ini, tim SemiAnalysis langsung mengomentari logika manajemen: 'Manajemen mengira bahwa memberikan anggaran Token yang lebih besar kepada karyawan akan mendorong mereka untuk mengotomatiskan tugas yang seharusnya tidak diotomatiskan, seperti menulis email. Kami berpendapat bahwa pandangan anti-otomatis ini terlalu naif.'

Permintaan Token murah terus tumbuh, pasar TaaS/API endpoint tidak mendingin

Manajemen anggaran tidak berarti mengurangi pemanggilan. Perusahaan lebih peduli pada biaya unit.

Permintaan Token murah masih kuat. Pasar Token-as-a-Service/API endpoint untuk model frontier dan open source terus tumbuh. Setelah AWS Bedrock dimasukkan ke dalam perhitungan, estimasi SemiAnalysis tentang tingkat pertumbuhan keseluruhan AWS kuartal ini lebih tinggi dari ekspektasi pasar.

Pemasok TaaS juga berekspansi. Perusahaan seperti Together, Fireworks, Baseten memiliki ARR gabungan lebih dari $4 miliar.

Ini menunjukkan bahwa tekanan anggaran perusahaan akan mengubah struktur pembelian. Masalah yang bisa diselesaikan dengan model murah tidak akan terus memanggil model termahal. Penurunan model default tidak berarti penggunaan AI berkurang, tetapi kurva biaya dioptimalkan ulang.

Kode masih menjadi kebutuhan terkuat, kereta AI tidak melambat karena batas anggaran

Skenario coding masih menjadi pendorong pendapatan AI terbesar saat ini, lebih dari 70% ARR OpenAI dan Anthropic berasal dari arah ini. B2B Anthropic melebihi 90% (OpenAI sekitar 60%), yang menentukan struktur pendapatan mereka lebih bergantung pada sisi perusahaan dan lebih stabil.

Gelombang pertumbuhan berikutnya diyakini akan berasal dari keamanan siber dan pekerjaan pengetahuan kerah putih. Dengan semakin menembusnya produk seperti Cowork, CoPilot, Codex, dan Computer ke perusahaan, jalur pertumbuhan ARR laboratorium AI yang didorong oleh pasar coding akan terulang kembali di skenario yang lebih luas.

Saat ini, pengeluaran AI per kapita sebagian besar perusahaan Fortune 500 masih jauh di bawah $2.000 per tahun, terutama terkonsentrasi di departemen teknik dan sains data. Ini berarti penetrasi AI di perusahaan masih dalam tahap awal, ruang pertumbuhan belum hilang, hanya berubah bentuk—dari 'membakar uang seenaknya' menjadi 'berinvestasi berkelanjutan dengan anggaran'.

ROI AI yang sebenarnya: peningkatan efisiensi, tetapi ekspektasi output juga naik bersamaan

Di perusahaan yang disurvei, contoh peningkatan efisiensi yang dibawa AI benar-benar ada dan efeknya signifikan.

  • Departemen perekrutan Amazon: proses dari penyaringan awal hingga penempatan tim, sebelumnya membutuhkan 6 hingga 9 bulan, setelah menggunakan alat AI dipersingkat menjadi 3 hingga 4 bulan

  • Sebuah perusahaan yang menyediakan layanan analisis data untuk 85% Fortune 500: pekerjaan yang sebelumnya membutuhkan waktu seminggu, sekarang hanya beberapa jam

Namun sisi lain dari peningkatan efisiensi adalah: ekspektasi output naik bersamaan. Seorang karyawan perusahaan solusi data dan risiko hukum mengakui bahwa beban kerja yang biasanya seminggu dikompresi menjadi beberapa jam, 'tetapi perusahaan justru mengharapkan dia menyelesaikan lebih banyak pekerjaan, akibatnya dia lebih sibuk dari sebelumnya.'

SemiAnalysis menunjukkan bahwa peristiwa pembengkakan Token di Uber, Meta, dan perusahaan lain disebabkan oleh insentif yang tidak tepat dan pengawasan yang longgar, bukan karena kurangnya skenario aplikasi dengan ROI tinggi. Meskipun Amazon melakukan PHK besar-besaran, karena peningkatan efisiensi dari alat AI, mereka merekrut karyawan baru dengan kecepatan yang lebih cepat—ini adalah catatan paling jelas dari AI sebagai 'tuas tenaga kerja'.

Peringatan Risiko dan Klausul Penafian

        Pasar berisiko, investasi harus hati-hati. Artikel ini bukan merupakan saran investasi pribadi, dan juga tidak mempertimbangkan tujuan investasi, kondisi keuangan, atau kebutuhan khusus masing-masing pengguna. Pengguna harus mempertimbangkan apakah pendapat, pandangan, atau kesimpulan apa pun dalam artikel ini sesuai dengan situasi spesifik mereka. Investasi berdasarkan artikel ini, risiko ditanggung sendiri.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan