Lofli: Di balik pemblokiran langganan Claude dan lobster, jalan keluar yang sebenarnya bukanlah token yang lebih murah

robot
Pembuatan abstrak sedang berlangsung

(Sumber: Mesin of Imagination)

Redaksi Mesin of Imagination

Di era agen, kita membutuhkan filosofi penagihan dan desain rekayasa yang benar. Itulah pandangan yang baru saja disampaikan oleh Robofly, kepala model besar Xiaomi MiMo, di X.

Beberapa hari lalu, kami melaporkan sebuah kabar — Anthropic mengumumkan bahwa mulai hari ini, pengguna langganan Claude Pro dan Max tidak boleh lagi menggunakan kuota langganan untuk kerangka agent pihak ketiga seperti OpenClaw. Jika ingin tetap menggunakannya? Maka Anda harus beralih ke API berbasis pemakaian. Hal ini membuat banyak pengguna Claude yang bermain dengan pola “lobster” menggunakan skema langganan langsung bingung.

Penjelasan resmi Anthropic mengatakan bahwa model penetapan harga berbasis langganan pada awalnya dirancang berdasarkan “intensitas penggunaan normal oleh pengguna perorangan”. Namun, tingkat penggunaan alat proxy otomatis seperti OpenClaw jauh melampaui perkiraan — ada pengguna berat yang hanya membayar biaya langganan 200 dolar per bulan, tetapi menghabiskan sumber daya komputasi senilai 5000 dolar, sehingga memberikan tekanan biaya yang besar bagi Anthropic.

Begitu berita itu keluar, respons dari berbagai pihak tidak seragam. Ada yang berteriak “ditikam dari belakang”, merasa skema langganan seketika kehilangan daya tarik; ada pula yang bertepuk tangan, menganggap ini sebagai upaya membersihkan penggunaan yang tidak efisien serta melindungi keberlanjutan seluruh platform.

Apa pun bentuk suaranya, masalah inti justru terungkap: kini model penagihan token sudah sangat sulit untuk mengatasi tantangan, dan kita memerlukan cara penggunaan komputasi yang lebih cerdas serta lebih berkelanjutan.

Dalam postingannya, Robofly pertama-tama menunjuk bahwa skema langganan Anthropic pada dasarnya dijalankan dengan rugi.

Langganan Claude Code adalah sistem distribusi alokasi komputasi yang dirancang dengan sangat baik. Penilaian saya adalah — kemungkinan besar itu tidak menghasilkan uang, bahkan mungkin mengalami kerugian, kecuali margin keuntungan API mereka 10–20 kali, tapi saya masih meragukannya. Saya tidak bisa menghitung secara tepat besarnya kerugian akibat integrasi kerangka pihak ketiga, namun saya pernah melihat langsung manajemen context OpenClaw — tulisannya buruk. Dalam satu permintaan dari pengguna, ia memicu beberapa putaran pemanggilan alat bernilai rendah, dan setiap putaran dikirim sebagai permintaan API yang berdiri sendiri, masing-masing membawa jendela konteks yang sangat panjang (sering kali melebihi 10.000 token) — bahkan jika cache berhasil, itu tetap sangat boros. Dalam kasus ekstrem, itu bahkan dapat meningkatkan tingkat cache yang tidak terpenuhi dari permintaan lain.

Jika dihitung, jumlah pemanggilan API aktual yang dipicu oleh setiap permintaan pengguna sebenarnya beberapa kali lipat lebih banyak daripada kerangka bawaan Claude Code. Jika dikonversi ke penetapan harga API, biaya sesungguhnya kira-kira puluhan kali lipat dari harga langganan. Ini bukan sekadar perbedaan — ini adalah sebuah lubang jebakan.

Mengenai rasa sakit yang dialami pengguna langganan yang diputus aksesnya, menurutnya, rasa sakit ini dalam jangka panjang justru bermanfaat, karena akan mendorong kemajuan rekayasa.

OpenClaw, OpenCode, dan kerangka pihak ketiga semacam itu masih bisa memanggil Claude melalui API, hanya saja tidak lagi bisa “naik gratis” dengan skema langganan. Dalam jangka pendek, pengguna Agent akan sangat merasakan sakitnya — biayanya bisa melonjak puluhan kali. Namun tekanan seperti inilah yang justru menjadi dorongan agar kerangka-kerangka tersebut benar-benar memperbaiki manajemen context, memaksimalkan tingkat keberhasilan prompt cache untuk memakai ulang konteks yang sudah diproses, serta memangkas konsumsi token yang tidak perlu. Rasa sakit pada akhirnya akan berubah menjadi disiplin rekayasa.

Sekaligus, ia mengeluarkan peringatan agar perusahaan model besar jangan terjebak perang harga, menjual Token dengan harga murah sambil membiarkan alat pihak ketiga “mengais” adalah jebakan.

Saya ingin menyarankan para vendor model besar: sebelum kalian memikirkan dengan matang cara menetapkan harga langganan untuk coding sehingga tidak sampai membengkak parah, jangan ikut terburu-buru masuk ke perlombaan harga sampai ke titik terendah. Menjual token dengan sangat murah, sekaligus membuka pintu lebar bagi kerangka pihak ketiga — di permukaan tampak ramah bagi pengguna, tetapi sebenarnya itu jebakan — Anthropic baru saja merangkak keluar dari jebakan itu. Masalah yang lebih dalam adalah: jika pengguna menghabiskan waktu dan tenaga untuk kerangka Agent berkualitas rendah, menghabiskan waktu pada layanan penalaran yang sangat tidak stabil dan lambat, menghabiskan waktu untuk model yang dipangkas demi menekan biaya, lalu akhirnya mendapati bahwa pada akhirnya tetap tidak bisa menyelesaikan apa pun — ini akan menjadi siklus buruk bagi pengalaman pengguna dan retensi.

Berikutnya, ia juga memperkenalkan MiMo Token Plan yang baru-baru ini diluncurkan oleh Xiaomi, serta menekankan bahwa mereka “mengejar penyerahan model dan layanan yang berkualitas tinggi secara stabil dalam jangka panjang”.

Mengenai MiMo Token Plan — ini mendukung integrasi kerangka pihak ketiga, dengan penagihan berdasarkan kuota token; logikanya sama dengan paket extra usage yang baru dirilis oleh Claude. Karena kami mengejar penyerahan model dan layanan berkualitas tinggi secara stabil dalam jangka panjang — bukan membuat kalian membayar secara impulsif, lalu meninggalkan kapal.

Pada akhirnya, ia menyebutkan bahwa pasokan komputasi global saat ini sudah tidak mampu lagi mengikuti kebutuhan token yang diciptakan oleh Agent. Jalan keluar yang sesungguhnya bukanlah token yang lebih murah, melainkan evolusi yang saling bersinergi — “kerangka Agent yang lebih hemat token” × “model yang lebih kuat, lebih efisien, dan lebih baik”. Aksi Anthropic kali ini, apa pun apakah mereka bermaksud atau tidak, sedang mendorong seluruh ekosistem — baik open-source maupun closed-source — ke arah itu. Ini mungkin merupakan kabar baik.

Terhadap pandangan Robofly, komunitas pengembang bereaksi kuat, dan fokus diskusi cepat bergeser dari “apakah tindakan Anthropic benar” menjadi beberapa masalah yang lebih mendasar:

1、 Ini bukan perselisihan penetapan harga, melainkan penulisan ulang struktural dalam ekonomi AI.

Seperti yang dikatakan Robofly, biaya per unit layanan AI selama ini tidak pernah ditentukan semata-mata oleh model, melainkan ditentukan oleh “model × kerangka × manajemen context” yang saling bertumpuk. Aksi Anthropic kali ini, tanpa disadari, menciptakan tekanan seleksi alami bagi kerangka agent.

Ada juga yang mengatakan secara langsung: sinyal yang benar-benar disampaikan oleh langkah Anthropic adalah — lapisan orkestrasi adalah produk, bukan hanya modelnya. Ketegangan antara skema langganan dan penetapan biaya berbasis API hanyalah gejala permukaan dari logika yang lebih dalam.

2、 Jangan buru-buru menyalahkan penetapan harga; lihat dulu bagaimana komputasi dibakar.

“Pemborosan komputasi” yang disebut Robofly mendapatkan resonansi kuat dari para pelaku industri. Ada yang menegaskan dengan tepat: ini sama sekali bukan masalah “AI terlalu mahal”, melainkan masalah “komputasi diboroskan” — uang yang dibakar tidak bisa ditukar dengan hasil nyata apa pun, karena desain kerangka yang kasar ditambah jendela konteks yang besar ditambah pemanggilan berlebihan yang tidak perlu.

Wawasan yang lebih dalam datang dari seorang pengembang yang menyatakan: keputusan dalam Claude Code terkait pengelolaan context sejak awal bukanlah sesuatu seperti parameter bawaan, melainkan kemampuan pengambilan keputusan yang dipahat dari proses berulang untuk menilai apa yang harus disimpan, apa yang harus dibuang, dan kapan harus melakukan kompresi—hingga akhirnya terpatri ke dalam arsitektur. Kerangka pihak ketiga tidak kekurangan fungsi, melainkan kekurangan opini rekayasa yang terintegrasi seperti itu.

Pengembang lain membuktikannya lewat pengalaman pribadinya: bulan lalu ia menghabiskan banyak waktu untuk membersihkan logika redundan di lapisan orkestrasi lama yang dibangun untuk klien; “membersihkan kekacauan itu ternyata jauh lebih melelahkan daripada saat membangunnya dulu”.

3、 Eliminasi pasar sudah dimulai, tetapi hasil akhirnya belum pasti.

Robofly berpendapat bahwa tekanan biaya akan mendorong evolusi kerangka, tetapi para pengembang mengajukan pertanyaan yang lebih kejam: apakah kerangka pihak ketiga bisa cukup cepat menutup kesenjangan efisiensi sehingga penetapan harga API tetap masuk akal secara ekonomi? Atau kebanyakan pengguna akan mendapati biayanya terlalu menyakitkan, lalu secara default kembali ke Claude Code?

Dua jalur ini mengarah ke lanskap ekosistem yang sangat berbeda. Ada pengembang yang menambahkan: yang benar-benar dibutuhkan oleh pengembang kerangka bukanlah hak akses “yang sudah termasuk”, melainkan batas kuota token yang jelas dan dapat diprediksi — batas yang tegas justru akan mendorong perilaku produk yang lebih baik, sementara wilayah abu-abu yang kabur hanya akan menciptakan kekacauan.

Postingan Robofly ini adalah sinyal evolusi teknis yang sangat visioner, dan diskusi terkait juga menyentuh inti masalah yang paling menyakitkan dalam rekayasa perangkat lunak AI saat ini. Selanjutnya, tinggal dilihat bagaimana seluruh pasar beralih dari “membakar komputasi secara serampangan” ke “arsitektur rekayasa yang terperinci”.

Berlimpah informasi, interpretasi yang akurat—semuanya ada di aplikasi Sina Finance

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan