Phân tích ngược Claude Code phát hiện ra hai lỗi bộ đệm có thể âm thầm đẩy chi phí API tăng gấp 10-20 lần

robot
Đang tạo bản tóm tắt

Tin tức từ CoinJie (币界网): theo sự theo dõi của 1M AI News, một nhà phát triển đã sử dụng Ghidra, proxy MITM và radare2 để phân tích ngược và tách rời tệp nhị phân 228MB của bản cài đặt độc lập Claude Code. Người này phát hiện hai lỗi bộ nhớ đệm (cache) độc lập, có thể làm tăng chi phí API lên 10-20 lần mà người dùng không hề hay biết. Phân tích liên quan đã được gửi lên GitHub (issue #40524), được Anthropic đánh dấu là lỗi hồi quy (regression) và giao cho một bộ phận xử lý.

Lỗi đầu tiên nằm trong runtime Bun tùy chỉnh được sử dụng bởi bản cài đặt độc lập. Mỗi khi thực hiện yêu cầu API, runtime sẽ tìm một mã định danh tính phí trong phần body của yêu cầu và thay thế. Tuy nhiên, logic thay thế lại khớp với mục phù hợp đầu tiên trong phần body của yêu cầu. Nếu lịch sử hội thoại tình cờ chứa đúng chuỗi đó (ví dụ: đã thảo luận về cơ chế tính phí nội bộ của Claude Code), việc thay thế sẽ khớp với nội dung tin nhắn thay vì chuỗi lời nhắc hệ thống, khiến mỗi lần yêu cầu đều kích hoạt việc xây dựng lại toàn bộ bộ nhớ đệm. Cách né tạm thời là chuyển sang chạy npx @anthropic-ai/claude-code; phiên bản gói npm không bao gồm đoạn logic thay thế này.

Lỗi thứ hai ảnh hưởng đến tất cả người dùng sử dụng --resume hoặc --continue để khôi phục phiên. Lỗi này được giới thiệu từ v2.1.69. Khi khôi phục phiên, vị trí chèn thông tin bổ sung của hệ thống khác với phiên mới tạo, dẫn đến tiền tố bộ nhớ đệm không khớp hoàn toàn; toàn bộ lịch sử hội thoại được đọc từ cache bị chuyển sang ghi lại toàn bộ. Các vòng tiếp theo khôi phục bình thường, nhưng riêng thao tác khôi phục đã tạo ra lượng chi phí phụ trội lớn; hiện không có phương án né từ bên ngoài.

Nhà phát triển ước tính rằng, với một cuộc hội thoại dài khoảng 500.000 token (token): Bug 1 sẽ làm phát sinh thêm khoảng 0.04 USD cho mỗi lần yêu cầu; Bug 2 sẽ làm phát sinh thêm khoảng 0.15 USD cho mỗi lần khôi phục. Hai lỗi cộng lại có thể khiến chi phí cho mỗi lần yêu cầu vượt quá 0.20 USD.

Trước đó, kỹ sư của Anthropic là Lydia Hallie đã xác nhận rằng tốc độ người dùng chạm ngưỡng giới hạn dùng lượng “nhanh hơn dự kiến rất nhiều”. Trong phần bình luận trên Reddit, nhiều người dùng cho rằng hai lỗi bộ nhớ đệm cache này có thể là một trong những nguyên nhân căn bản khiến mức tiêu thụ dùng lượng bất thường.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim