Claude Fable 5: hitung mundur biaya per pemakaian, bagaimana cara menggunakan model terkuat agar tagihan tidak membengkak?

TL;DR
· Claude Fable 5 telah kembali diakses pada 1 Juli, setelah 7 Juli lebih banyak penggunaan akan beralih ke usage credits.
· Harga resmi adalah $10 per juta input token, $50 per juta output token, sesi panjang dan loop otomatis dapat memperbesar konsumsi.
· Pengguna lebih cocok menggunakan Fable 5 di tahap perencanaan dan peninjauan, dan menyerahkan tugas eksekusi ke model yang lebih murah.

Setelah Claude Fable 5 dibuka kembali, diskusi tentang cara menghemat biaya token yang tinggi menjadi fokus pengguna. Model andalan yang disebut Anthropic sebagai "model paling mampu yang dirilis secara luas" ini, dirancang untuk penalaran intensif dan tugas agen jangka panjang, mendukung jendela konteks 1 juta token, output maksimal 128 ribu token. Masalah langsung yang ditimbulkan oleh peningkatan kemampuan adalah bahwa pengguna di Claude Code, Managed Agents, atau sesi panjang, dapat membuat model terus berpikir, memanggil alat, memeriksa berulang kali, yang memperbesar tekanan tagihan.

Menurut halaman resmi Anthropic, Claude Fable 5 telah kembali diakses pada 1 Juli 2026, untuk pengguna Pro, Max, Team, Enterprise, serta melalui saluran seperti Claude Platform, AWS, Google Cloud, Microsoft Foundry. Harga resmi adalah $10 per juta input token, $50 per juta output token, harga pembacaan prompt caching setara dengan diskon hingga 90% dari harga input.

Anthropic dalam pengumuman "Redeploying Fable 5" menyatakan bahwa pengguna Pro, Max, Team, dan beberapa Enterprise, sebelum 7 Juli, dapat menggunakan model ini dalam maksimal 50% batas mingguan. Setelah itu, penggunaan selanjutnya akan ditagih melalui usage credits.

Oleh karena itu, Fable 5 tidak cocok digunakan sebagai model obrolan default. Ia lebih seperti arsitek dan peninjau yang mahal, cocok untuk menentukan arah di awal tugas, dan memeriksa kualitas sebelum tugas selesai, sementara sebagian besar pekerjaan eksekusi di antaranya diserahkan ke model yang lebih murah.

Yang paling mahal bukan satu jawaban, tetapi tugas panjang yang berjalan otomatis

Tekanan biaya Fable 5 pertama-tama berasal dari harga satuan.

$10 per juta input token, $50 per juta output token, membuatnya menjadi model mahal. Saat tanya-jawab pendek, pengguna mungkin tidak merasakannya. Tetapi begitu masuk ke skenario rantai panjang seperti modifikasi kode, pengorganisasian data, proposal produk, tugas penelitian, agen otomatis, output token, konteks, panggilan alat, dan koreksi berulang akan bertambah.

Yang lebih mudah memperbesar konsumsi adalah keunggulan Fable 5.

Dokumen resmi memposisikannya sebagai cocok untuk long-horizon agentic work, yaitu pekerjaan agen jangka panjang. Ia dapat memecah tugas menjadi beberapa tahap, secara aktif memeriksa celah, dan jika perlu melanjutkan dengan memanggil alat atau subtugas. Untuk tugas kompleks, ini sangat berharga, pengguna tidak perlu memberikan petunjuk manual setiap langkah, model dapat melakukan iterasi sendiri sesuai tujuan.

Tetapi jika tujuan tidak jelas, batasan terlalu luas, waktu terlalu lama, model dapat terus berjalan demi menyelesaikan tugas dengan lebih sempurna. Penulis asli mengatakan bahwa dalam beberapa jam pertama pengujian, ia hampir menghabiskan batas penggunaan, meskipun tidak melakukan tugas yang sangat luar biasa. Pengalaman semacam ini lebih seperti umpan balik pengguna, bukan perhitungan biaya resmi, tetapi mengingatkan akan risiko nyata: sesi panjang, loop otomatis, dan penyalahgunaan default, setelah 7 Juli akan langsung menjadi konsumsi credits.

"10-80-10": Hanya gunakan Fable di dua ujung kritis

Metode inti yang diajukan penulis asli adalah mengubah Fable 5 dari "pelaksana penuh" menjadi "penjaga di awal dan akhir".

Yang disebut "10-80-10", kira-kira sesuai dengan tiga tahap proyek AI.

10% pertama gunakan Fable untuk perencanaan. Biarkan ia mendefinisikan struktur tugas, jalur eksekusi, kriteria keberhasilan, batasan, dan format pengiriman. Ia paling cocok bukan untuk eksekusi mekanis, tetapi untuk menyusun skema yang jelas sebelum tugas kompleks dimulai.

80% tengah ganti dengan model yang lebih murah untuk eksekusi. Sebagian besar token biasanya dikonsumsi dalam modifikasi berulang, penyesuaian format, perbaikan kecil kode, pengorganisasian data, generasi biasa, dan iterasi bolak-balik. Bagian pekerjaan ini belum tentu membutuhkan partisipasi penuh Fable 5, dapat diserahkan ke Opus, Sonnet, Haiku, atau model biaya lebih rendah lainnya.

10% terakhir bawa Fable kembali untuk peninjauan. Setelah model murah menyelesaikan eksekusi utama, biarkan Fable memeriksa apakah hasil menyimpang dari rencana awal, ada yang terlewat, bagian mana yang perlu diperbaiki, apakah mencapai standar rilis. Karena saat ini ia memeriksa produk yang sudah ada, bukan membuat konten dari nol, konsumsi token biasanya jauh lebih rendah.

Metode ini bukan formula penghematan yang dijamin resmi. Penulis asli menyebutkan bahwa dalam beberapa skenario, mengganti lapisan eksekusi dengan model murah dapat mengurangi biaya token lebih dari 50%, tetapi ini lebih dipahami sebagai pengalaman penggunaan. Ide yang benar-benar dapat direplikasi adalah bahwa model kelas atas tidak perlu menanggung semua pekerjaan intensif token, ia lebih cocok ditempatkan di tahap penilaian, arsitektur, dan identifikasi kesalahan.

/goal dan /loop membuat agen lebih berguna, juga membuat biaya lebih sulit terdeteksi

Perubahan lain dari Fable 5 adalah lebih cocok untuk alur kerja agen.

Dalam cara prompt tradisional, pengguna mengajukan pertanyaan, model menjawab. Pengguna memeriksa lalu bertanya lagi, loop didorong oleh manusia. Apakah melanjutkan, memperbaiki, atau berhenti, semuanya diputuskan oleh pengguna.

Di lingkungan Claude Code, /goal dan /loop mengubah proses ini menjadi cara eksekusi yang lebih otomatis.

Dokumen Anthropic menunjukkan bahwa /goal akan terus berjalan hingga kondisi terpenuhi atau pengguna menghapusnya, dan dapat menampilkan token spend. Resmi juga menyarankan pengguna menambahkan batas waktu atau putaran seperti "berhenti setelah 20 putaran". Tujuan yang lebih baik bukan hanya "bantu saya mengubah kode", tetapi menjelaskan apa yang harus diselesaikan, bagaimana memverifikasi hasil, batasan apa yang tidak boleh dilanggar, dan kapan harus berhenti.

/loop digunakan untuk menjalankan prompt secara berulang dengan interval, misalnya memeriksa status deployment setiap 5 menit, juga dapat dipilih secara dinamis oleh Claude. Dokumen resmi menunjukkan bahwa tugas loop memiliki aturan kedaluwarsa 7 hari. Fungsi semacam ini cocok untuk pemantauan, iterasi, pemeriksaan, perbaikan jangka panjang, dan tugas agen, model dapat terus maju tanpa menunggu pengguna memberikan petunjuk berulang.

Risiko biaya juga muncul di sini.

Loop otomatis mengubah "konfirmasi manual manusia untuk langkah selanjutnya" menjadi "model terus berjalan sesuai rencana". Jika tujuan terlalu luas, kondisi akhir kabur, interval terlalu rapat, durasi terlalu lama, Fable 5 dapat terus mengonsumsi token setelah pengguna pergi. Semakin baik model dalam menemukan masalah, menambahkan langkah, dan memeriksa diri sendiri, semakin perlu pengguna menetapkan batas keras di awal.

Oleh karena itu, 10-80-10 dan loop engineering lebih cocok digunakan bersama: Fable 5 bertanggung jawab merancang loop, menetapkan tujuan dan kriteria penerimaan; lapisan eksekusi sebisa mungkin diserahkan ke model murah; hanya ketika loop ditutup, hasil perlu dinilai, atau simpul kritis perlu diperiksa kualitas, barulah Fable 5 diintervensi.

Setelah 7 Juli, pemilihan model dan batas pengeluaran perlu diperiksa ulang

Bagi pengguna biasa, risiko paling langsung bukan alur kerja kompleks, tetapi penyalahgunaan.

Penulis asli mengingatkan bahwa saat membuka Claude Code atau aplikasi Claude, model mungkin secara default memilih Fable. Pernyataan ini lebih seperti pengalaman pengguna, dokumen resmi tidak menyatakannya sebagai aturan seragam. Tetapi pada fase model baru dibuka kembali dan platform mendorong pengguna untuk menguji, beberapa pengguna memang mungkin tanpa sengaja menggunakan model termahal dalam obrolan biasa, pengorganisasian sederhana, atau tugas bernilai rendah.

Setelah penagihan credits dimulai, penyalahgunaan ini akan lebih sensitif. Percakapan sederhana, penulisan ulang ringan, format pengaturan, ringkasan biasa, belum tentu membutuhkan Fable 5. Memeriksa pemilih model sebelum memulai setiap sesi mungkin menjadi tindakan dasar bagi pengguna frekuensi tinggi.

Pengingat realistis lainnya adalah mengatur spending cap.

Dokumen dukungan Anthropic menunjukkan bahwa usage credits perlu diaktifkan di Settings > Usage, pengguna dapat mengatur metode pembayaran dan membeli atau mengisi ulang credits, serta mengonfigurasi monthly spending cap, auto-reload, dan usage alerts. Claude Code juga berlaku untuk usage credits.

Tanpa batas bulanan, tugas panjang, loop otomatis, dan eksekusi agen dapat mengakumulasi biaya signifikan dalam waktu singkat. Bagi pengguna frekuensi tinggi, menetapkan batas pengeluaran bulanan, menggunakan pengingat, dan menulis kondisi berhenti yang jelas di /goal atau /loop, bukan lagi hanya pengaturan keuangan, tetapi bagian dari penggunaan model agen.

Kebiasaan baru yang dibawa oleh model seperti Fable 5 adalah mengalokasikan model berdasarkan nilai dan kesulitan tugas. Perencanaan, penilaian kompleks, peninjauan akhir layak menggunakan Fable; eksekusi berulang, generasi biasa, dan modifikasi ringan, lebih cocok untuk model murah. Model kelas tinggi sedang berubah dari "chatbot yang lebih pintar" menjadi "agen yang dapat bekerja secara otomatis", semakin kuat kemampuannya, semakin perlu pengguna menetapkan tujuan, batas, waktu, dan anggaran sebelumnya. Jika tidak, tagihan yang tidak terkendali mungkin muncul lebih cepat daripada kegagalan tugas.

Klik untuk mengetahui posisi yang sedang direkrut oleh BlockBeats

Selamat bergabung dengan komunitas resmi BlockBeats:

Telegram subscription group: https://t.me/theblockbeats

Telegram discussion group: https://t.me/BlockBeats_App

Twitter official account: https://twitter.com/BlockBeatsAsia

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan