Membongkar Claude Code secara terbalik menemukan dua bug cache, yang dapat secara diam-diam meningkatkan biaya API sebesar 10-20 kali lipat

robot
Pembuatan abstrak sedang berlangsung

Berita dari Coin World: berdasarkan pemantauan 1M AI News, seorang pengembang membongkar secara rekayasa balik berkas biner independen versi terpasang Claude Code berukuran 228MB menggunakan Ghidra, proxy MITM, dan radare2, serta menemukan dua bug cache yang berdiri sendiri. Bug-bug ini dapat menaikkan biaya API hingga 10-20 kali tanpa sepengetahuan pengguna. Analisis terkait telah diajukan ke GitHub (issue #40524), ditandai oleh Anthropic sebagai bug regresi dan ditugaskan untuk penanganan. Bug pertama ada di runtime Bun khusus yang digunakan oleh versi terpasang independen. Setiap kali ada permintaan API, runtime akan mencari pengidentifikasi penagihan di dalam body permintaan lalu melakukan penggantian, tetapi logika penggantian justru mengenai item yang pertama kali cocok di body permintaan. Jika riwayat percakapan secara kebetulan memuat string tersebut (misalnya membahas mekanisme penagihan internal Claude Code), penggantian akan mengenai isi pesan, bukan prompt sistem, sehingga setiap permintaan memicu pembangunan ulang cache secara penuh. Metode mitigasi sementara adalah beralih untuk menjalankan npx @anthropic-ai/claude-code; versi paket npm tidak memuat logika penggantian ini. Bug kedua memengaruhi semua pengguna yang memulihkan sesi menggunakan --resume atau --continue, yang diperkenalkan sejak v2.1.69. Saat memulihkan sesi, posisi injeksi informasi tambahan sistem berbeda dibanding sesi baru, sehingga prefix cache tidak sepenuhnya cocok—seluruh riwayat percakapan dibaca dari cache berubah menjadi ditulis ulang secara penuh. Putaran berikutnya pemulihan berjalan normal, tetapi operasi pemulihan itu sendiri telah menimbulkan banyak biaya tambahan; saat ini belum ada solusi penghindaran eksternal. Pengembang tersebut memperkirakan, untuk percakapan panjang sekitar 500 ribu token, Bug 1 menghabiskan tambahan sekitar 0.04 dolar AS untuk setiap permintaan, Bug 2 menghabiskan tambahan sekitar 0.15 dolar AS untuk setiap pemulihan—jika digabungkan, biaya per permintaan tunggal dapat melebihi 0.20 dolar AS. Sebelumnya, insinyur Anthropic Lydia Hallie telah mengonfirmasi bahwa kecepatan pengguna yang menyentuh batas kuota penggunaan lebih cepat daripada yang “diperhitungkan”, dan di kolom komentar Reddit banyak pengguna berpendapat bahwa dua bug cache ini mungkin menjadi salah satu penyebab utama konsumsi kuota yang tidak normal.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan