Garis lain dari melemahnya tren AI: OpenAI juga harus menurunkan harga

Ringkasan Singkat

· Eksekutif Uber secara langsung mengatakan, hubungan antara konsumsi Token dan peningkatan produk nyata "belum ada"; OpenAI juga mengakui biaya AI perusahaan menjadi masalah yang semakin nyata.

· Permintaan AI tidak hilang, tetapi perusahaan mulai beralih dari percobaan ke audit ROI, produsen model mulai membahas penurunan harga, pertumbuhan cloud, GPU, dan pusat data perlu diverifikasi kembali.

· Indikator terkait: NVDA, MSFT, AMZN, GOOG, MU, AVGO, AMD, TSM, ARM, ORCL.

Pergerakan saham AI AS yang naik dua bulan berturut-turut, akhir-akhir ini mulai melemah dan melakukan koreksi, pasar juga mulai mencari penyebabnya secara terbuka.

Suku bunga, valuasi yang penuh sesak, gangguan laporan keuangan semuanya bisa menjelaskan koreksi ini, tetapi pasar sedang mengaudit sebuah asumsi yang lebih mendasar: apakah konsumsi Token yang lebih tinggi oleh perusahaan pasti akan membawa lebih banyak pendapatan, efisiensi, dan keuntungan.

Dalam dua tahun terakhir, rantai perdagangan AI berjalan sangat lancar. Perusahaan menggunakan AI secara besar-besaran, konsumsi Token (satuan pengukuran model dalam memproses teks) meningkat, pendapatan produsen model bertambah, penyedia cloud menjual lebih banyak daya komputasi, GPU, HBM (memori bandwidth tinggi), server, pusat data, dan kebutuhan listrik terus berkembang. Selama konsumsi Token terus meningkat, pasar dapat menganggapnya sebagai percepatan adopsi AI, dan memberi valuasi lebih tinggi pada hardware dan pengeluaran modal hulu.

Namun perubahan yang muncul belakangan ini adalah, bahkan vendor model sendiri mulai membahas masalah biaya.

Menurut laporan Wall Street Journal, OpenAI sedang meneliti penurunan harga panggilan model lebih lanjut, untuk mengatasi tekanan anggaran perusahaan dan tantangan dari pesaing seperti Anthropic. Sementara itu, CEO OpenAI Sam Altman baru-baru ini menyatakan secara terbuka bahwa semakin banyak perusahaan mulai memandang biaya AI sebagai masalah penting, beberapa pelanggan bahkan telah menghabiskan anggaran AI tahunan mereka dalam kuartal pertama.

Peristiwa ini mungkin belum cukup untuk mengubah pola industri, tetapi mengirimkan sinyal yang patut diperhatikan: pasar mulai membahas bukan hanya kemampuan model, tetapi juga biaya, penetapan harga, dan ROI.

Sekarang yang mulai melonggar bukanlah "perusahaan masih menggunakan AI" tetapi "perusahaan bersedia terus membayar Token dengan harga tinggi tanpa syarat".

Presiden dan Chief Operating Officer Uber Andrew Macdonald mengatakan dalam podcast, bahwa hubungan antara pertumbuhan konsumsi Token dan "fungsi pengguna yang berguna" "belum ada". Kalimat ini berasal dari pihak yang membayar, bukan dari penjual, bank investasi, atau startup model.

Jika sebelumnya pasar percaya bahwa "volume adalah keberhasilan", sekarang memasuki tahap kedua: apakah Token akhirnya bisa menjadi pertumbuhan pendapatan, pengurangan biaya tenaga kerja, atau peningkatan margin keuntungan. Jika pertanyaan ini secara sistematis diajukan oleh departemen keuangan, maka bahasa penilaian rantai industri AI akan beralih dari "permintaan tak terbatas" ke "verifikasi pengembalian".

Keterbatasan tinggi Uber mengungkap tekanan anggaran

Perlu dicatat bahwa kasus Uber tidak karena mereka tidak memahami AI, atau karena mereka tidak mau menggunakan AI. Justru sebaliknya, tingkat adopsi alat AI di Uber sangat tinggi. Menurut berbagai media, dari sekitar 5000 insinyur perusahaan, tingkat penggunaan bulanan pernah mencapai 84% hingga 95%, dengan tagihan bulanan per insinyur berkisar dari ratusan hingga 2000 dolar.

Masalahnya justru di sini. Ketika tingkat penggunaan cukup tinggi, tagihan tidak lagi menjadi biaya percobaan kecil di departemen inovasi, tetapi menjadi biaya nyata yang harus dijelaskan oleh tingkat operasional. Menurut CTO perusahaan sebelumnya, anggaran Claude Code tahunan Uber dalam 4 bulan sudah habis. Macdonald menyebut ini sebagai momen yang "membuat kepala pusing".

Di dalam perusahaan, alat AI awalnya masuk anggaran dengan alasan "meningkatkan efisiensi". Insinyur bisa menghasilkan kode lebih cepat, layanan pelanggan menjawab pertanyaan lebih cepat, tim operasional menulis laporan lebih cepat—semua perubahan yang mudah dirasakan.

Namun, setelah skala penggunaan membesar, departemen keuangan akan melihat pertanyaan yang lebih keras: Apakah ini membawa lebih banyak pendapatan? Apakah mengurangi biaya tenaga kerja nyata? Apakah meningkatkan margin keuntungan?

Fenomena "tokenmaxxing" yang disebut Macdonald juga menunjukkan bahwa penggunaan tinggi mungkin tidak selalu sejalan dengan nilai tinggi. Yang dimaksud tokenmaxxing adalah tim atau individu yang memaksimalkan penggunaan AI dengan konsumsi Token besar-besaran. Data penggunaan terlihat bagus, tetapi belum tentu menghasilkan produk yang lebih baik. Bagi penyedia layanan AI, ini adalah pendapatan; bagi perusahaan, ini mungkin hanya tagihan cloud yang tidak terkendali.

Sinyal dari Uber lebih penting daripada sekadar "AI terlalu mahal".

Bukan berarti AI tidak berguna, tetapi ketika AI masuk ke anggaran operasional dari anggaran percobaan, perusahaan perlu membuktikan bahwa setiap dolar pengeluaran Token dapat menghasilkan hasil bisnis yang terukur. Tingkat adopsi tinggi tidak lagi otomatis berarti keberhasilan, malah akan lebih dulu mengungkap struktur biaya.

Tekanan biaya mulai menyebar di seluruh rantai industri

Perusahaan pembeli mulai menghitung biaya, dan platform juga mengubah cara penagihan.

GitHub telah mengumumkan bahwa mulai 1 Juni 2026, Copilot akan beralih ke model penagihan berdasarkan penggunaan, dan memperkenalkan AI Credits bulanan. Bagi pengguna ringan, ini mungkin hanya perubahan struktur tagihan; tetapi bagi pengembang yang sering menggunakan fitur AI, beberapa pengguna berat melaporkan bahwa biaya satu sesi bisa mencapai puluhan dolar, dan diskusi komunitas pun meningkat.

Ini berarti platform tidak lagi bersedia menanggung biaya panggilan model tanpa batas dalam biaya langganan tetap.

Dulu, pengguna membayar satu bulan penuh, dan platform menanggung biaya panggilan model di baliknya. Sekarang, dengan meningkatnya jumlah panggilan, panjang konteks, dan multi-tugas, biaya menjadi lebih terlihat. Semakin banyak digunakan, semakin banyak dibayar—ini adalah revisi dari narasi "AI tanpa batas".

Lebih menarik lagi, tekanan ini sudah menyebar dari lapisan aplikasi ke lapisan model.

Dua tahun terakhir, narasi utama industri model besar adalah pengurangan biaya dan efisiensi skala. Tetapi seiring departemen pengadaan perusahaan mulai mengaudit ROI, produsen model menghadapi pertanyaan baru: jika pelanggan tidak mau terus membayar Token dengan harga tinggi, bagaimana pertumbuhan bisa dipertahankan?

Sinyal yang dikeluarkan OpenAI baru-baru ini sangat khas. Di satu sisi, Sam Altman mengakui anggaran perusahaan sedang tertekan, di sisi lain, muncul kabar bahwa OpenAI sedang meneliti penurunan harga lebih lanjut. Ini menunjukkan bahwa fokus industri beralih dari "kemampuan model apakah unggul" ke "biaya per unit kecerdasan cukup rendah".

Bagi pelanggan perusahaan, pertanyaan terpenting bukan lagi model mana yang paling kuat, tetapi model mana yang bisa menghasilkan lebih banyak hasil bisnis dengan anggaran yang sama.

Microsoft juga mengurangi lisensi Claude Code secara internal, menurut laporan The Verge, Axios, TechRadar, mereka membatalkan sebagian besar lisensi Claude Code internal dan beralih ke alat Copilot sendiri. Skala dan alasan pasti masih belum banyak diungkap, jadi belum bisa dikatakan Microsoft sudah mengurangi pembelian alat eksternal karena biaya.

Namun, langkah ini setidaknya menunjukkan bahwa perusahaan teknologi besar juga sedang meredistribusi biaya panggilan model eksternal.

Ini berpengaruh pada rantai industri AI, bukan karena pendapatan satu alat berkurang banyak, tetapi karena disiplin pembeli mulai mengalir ke atas. Perusahaan bisa membatasi kuota, memilih model lebih murah, mengalihkan sebagian tugas ke sumber terbuka atau solusi buatan sendiri, dan meminta diskon dari penyedia. Produsen model dan perusahaan aplikasi tetap akan ada permintaan, tetapi kekuasaan penetapan harga tidak lagi hanya ditentukan oleh "kemampuan model", melainkan juga oleh "apakah pelanggan mampu menghitung biaya".

Cloud provider juga akan terpengaruh. Dulu, pendapatan cloud dari AI sangat kuat: pelatihan model, inferensi, aplikasi perusahaan membutuhkan daya komputasi, semakin banyak Token digunakan, semakin pasti kebutuhan cloud. Tetapi jika perusahaan mulai menekan biaya per Token, atau mengalihkan tugas frekuensi tinggi dan nilai rendah ke jalur inferensi yang lebih murah, pendapatan cloud bisa lebih rendah dari yang diperkirakan sebelumnya.

Konsumsi tinggi harus membuktikan nilai tinggi

Pada titik ini, perusahaan mulai melakukan audit, salah satu alasannya adalah penggunaan AI sudah cukup besar, bagian yang tidak efisien tidak lagi mudah diabaikan.

Entelligence.AI merilis analisis pada Mei 2026, memeriksa 2444 organisasi dan lebih dari 1 juta Pull Request. Berdasarkan perhitungan mereka, dari setiap 1 dolar biaya Token AI, hanya 0,18 dolar yang benar-benar memberikan nilai nyata kepada pengguna, 0,44 dolar digunakan untuk memperbaiki bug yang diperkenalkan AI, 0,27 dolar untuk pengerjaan ulang, dan 0,11 dolar untuk friksi dalam review.

Data ini tidak bisa dijadikan kesimpulan industri secara keseluruhan. Data berasal dari halaman riset vendor sendiri, dan terutama mencerminkan skenario pengembangan perangkat lunak, bukan audit independen atau makalah akademik. Tetapi cukup untuk menunjukkan satu hal: perusahaan memang menghadapi tekanan ROI, terutama dalam skenario di mana konten yang dihasilkan AI masih perlu direview, diperbaiki, dan diintegrasikan oleh manusia.

Alat AI paling mudah menunjukkan kecepatan produksi, tetapi perusahaan benar-benar membayar untuk hasil yang dapat diserahkan. Jika kode yang dihasilkan AI membawa lebih banyak bug, membutuhkan review, pengerjaan ulang, dan pengujian lebih banyak, waktu yang dihemat di front-end akan kembali di back-end. Untuk pengguna individu, ini mungkin hanya masalah pengalaman; tetapi untuk perusahaan besar, ini menjadi masalah keuangan dan manajemen organisasi.

Ini juga menjelaskan mengapa pertumbuhan konsumsi Token tidak bisa lagi disamakan dengan keberhasilan AI secara sederhana.

Token adalah satuan pengukuran pendapatan dan biaya. Bagi produsen model, lebih banyak Token berarti lebih banyak pendapatan; bagi perusahaan, lebih banyak Token hanya layak jika menghasilkan lebih banyak pendapatan, biaya lebih rendah, atau margin keuntungan lebih tinggi.

Jika sebelumnya pasar menganggap pertumbuhan Token sebagai indikator utama permintaan hardware, sekarang harus menambahkan satu aspek lagi: konversi nilai Token. Hanya jika konsumsi Token secara stabil mengubah menjadi hasil bisnis, pendapatan AI dari cloud, pesanan GPU, perluasan HBM, dan pembangunan pusat data akan memiliki dukungan yang lebih kokoh.

Willingness to pay akan menyebar ke atas rantai industri

Strategi makro Andreas Steno Larsen baru-baru ini menunjukkan bahwa Indeks Pengeluaran Token LLM terkait Silicon Data adalah salah satu grafik yang patut diikuti di pasar saat ini. Laporan terkait menunjukkan bahwa indeks ini melacak pengeluaran atau harga yang dibayar perusahaan untuk setiap juta Token, dan setelah naik signifikan awal 2026, pada akhir Mei mulai menunjukkan penurunan.

Di sini perlu menjaga batas. Halaman publik Silicon Data lebih banyak berisi pengenalan produk, metode indeks dan data historis lengkap belum dipublikasikan secara lengkap. Ini bukan kesimpulan pasti, tetapi bisa menjadi sinyal perubahan keinginan pembayaran perusahaan.

Penurunan indeks pengeluaran Token tidak berarti penggunaan AI menurun.

Faktanya, pasar saat ini lebih seperti menyaksikan peralihan dari "kompetisi daya komputasi" ke "kompetisi biaya per unit kecerdasan". Perusahaan tetap membutuhkan AI, tetapi mungkin tidak mau lagi membeli dengan harga lama.

Jika OpenAI akhirnya meluncurkan penyesuaian harga baru, maka selain meringankan tekanan anggaran perusahaan, ini juga menandai masuknya industri model ke tahap kompetisi harga. Saat itu, pasar harus menilai kembali: pertumbuhan di masa depan berasal dari permintaan baru, atau dari peningkatan volume penggunaan setelah harga turun.

Permintaan AI mungkin tetap tumbuh, tetapi nilai pendapatan dan elastisitas transmisi ke hulu bisa berubah.

Dampaknya berbeda di setiap bagian. Lapisan aplikasi dan model akan menghadapi tekanan harga terlebih dahulu: perusahaan akan menuntut ROI yang lebih jelas, mengurangi panggilan bernilai rendah, atau beralih biaya antar model.

Cloud provider menghadapi masalah elastisitas pendapatan: jika volume penggunaan sama, tetapi harga per unit turun, cache dan batch processing meningkat, dan solusi buatan sendiri bertambah, pertumbuhan pendapatan cloud AI mungkin tidak sebaik pertumbuhan total Token.

Di hulu, pesanan GPU, HBM, kemasan canggih, server, dan pembangunan pusat data adalah transaksi pengeluaran modal masa depan. Jika disiplin pembayaran perusahaan membuat produsen model dan cloud provider lebih berhati-hati terhadap pendapatan masa depan, maka jadwal pesanan hardware dan pembangunan pusat data akan dievaluasi ulang.

Peringatan Larsen bukan berarti kebutuhan hardware hilang segera, tetapi jika harga Token terus melemah, pasar akan mulai meragukan kemiringan siklus investasi infrastruktur AI ini.

Koreksi saham AI dan audit tagihan Token bukan hubungan sebab-akibat yang sederhana. Tidak bisa dikatakan bahwa penurunan saham chip disebabkan oleh Uber yang menghabiskan anggaran, tetapi keduanya berada dalam rantai yang sama: ketika valuasi sudah mencerminkan pertumbuhan jangka panjang yang tinggi, setiap sinyal tentang keinginan pembayaran akhir dan ROI akan diperbesar menjadi penilaian ulang pengeluaran modal hulu.

Langkah selanjutnya adalah melihat laporan keuangan tentang elastisitas pendapatan dan ritme pesanan

Bukti saat ini belum cukup mendukung "gelembung AI telah pecah". Perusahaan tidak berhenti menggunakan AI, pengembang juga tidak akan kembali ke kondisi tanpa Copilot, Claude, atau alat inteligensi lainnya. Penilaian yang lebih realistis adalah bahwa adopsi AI sedang beralih dari kegilaan awal ke tahap disiplin anggaran, dan pasar mulai membedakan mana use case yang bisa membuktikan ROI, mana yang hanya membuat tagihan.

Langkah paling penting berikutnya adalah mengamati bahasa laporan keuangan cloud dan perusahaan perangkat lunak: apakah pertumbuhan pendapatan AI cloud dari Microsoft, Amazon, Google tetap tinggi; bagaimana perubahan dalam renewal, downgrade, dan keluhan terkait alat seperti Copilot dan Claude Code; semua ini akan lebih menunjukkan apakah disiplin pembeli sedang menguat secara sistematis daripada sekadar pergerakan harga saham harian.

Di sisi hardware, perlu memperhatikan apakah ada tanda-tanda revisi pesanan GPU, HBM, dan pusat data. Selama pengeluaran modal cloud terus meningkat, dan pesanan chip canggih tetap ketat, keinginan membayar Token yang menurun akan lebih seperti penyesuaian sehat. Jika pendapatan cloud AI melemah, dan pesanan hulu serta pembangunan pusat data mulai melambat, pasar akan menilainya sebagai titik balik siklus yang lebih dalam.

AI trading belum berakhir, tetapi bahasa penetapan harganya sedang berubah. Dulu pasar bertanya "berapa banyak Token yang digunakan", sekarang harus bertanya "berapa banyak keuntungan yang akhirnya dihasilkan dari Token ini". Perbedaan ini akan menentukan arah perbedaan valuasi rantai industri AI ke depan.

Klik untuk mengetahui posisi Lowdown BlockBeats yang sedang dibuka

Selamat bergabung dengan komunitas resmi Lowdown BlockBeats:

Telegram Langganan: https://t.me/theblockbeats

Telegram Grup Diskusi: https://t.me/BlockBeats_App

Akun resmi Twitter: https://twitter.com/BlockBeatsAsia

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan