Anthropic phản hồi về khủng hoảng hạn mức Claude Code: đề xuất không sử dụng Opus và đóng băng ngữ cảnh khoảng 1 triệu, không đề cập đến bồi thường

BlockBeatNews · 2026-04-03T01:20:42+00:00

Nhóm nghiên cứu của Anthropic Claude Code đã điều tra tranh chấp về hạn mức, cho rằng việc hạn chế hạn mức vào giờ cao điểm là nguyên nhân chính và đưa ra các đề xuất tiết kiệm, nhưng không cung cấp bồi thường. Trái với phản hồi của người dùng, nhóm nhấn mạnh “không tính phí quá mức,” gây ra sự nghi ngờ. Các phản ánh của người dùng về việc hạn mức nhanh chóng cạn kiệt tập trung, Anthropic coi đây là vấn đề ưu tiên. Tổng thể, nhóm đổ trách nhiệm cho cách sử dụng của người dùng, không thể giải quyết hiệu quả những phiền toái của người dùng.

BlockBeatNews

2026-04-03 01:20:42

Đang tạo bản tóm tắt

Theo sự giám sát của 1M AI News, các thành viên trong đội ngũ Anthropic Claude Code là Lydia Hallie đã công bố kết quả điều tra về tranh cãi liên quan đến giới hạn trong gần hai tuần qua. Kết luận là: vào thời điểm cao điểm, giới hạn thực sự đã bị siết chặt, mức tiêu hao của các phiên hội thoại 1 triệu token tăng lên, “đó chính là phần lớn nguyên nhân khiến các bạn cảm nhận được như vậy”. Cô cho biết nhóm đã sửa một số bug, nhưng nhấn mạnh: “Không có bất kỳ bug nào dẫn đến việc thu phí thêm.”

Sau đó, cô đưa ra các khuyến nghị để tiết kiệm:

Người dùng Pro mặc định dùng Sonnet 4.6 thay vì Opus, vì tốc độ tiêu hao của Opus xấp xỉ gấp đôi
Khi không cần suy luận sâu thì giảm mức độ suy luận hoặc tắt extended thinking
Không khôi phục lại các phiên hội thoại dài bị nhàn rỗi quá một giờ; hãy mở một phiên mới
Đặt biến môi trường CLAUDE_CODE_AUTO_COMPACT_WINDOW=200000 để giới hạn kích thước cửa sổ ngữ cảnh

Không đề cập bất kỳ hình thức nào về việc reset giới hạn hoặc bồi thường.

Người dẫn podcast AI là Alex Volkov đã tóm tắt phản hồi này là “bạn cầm sai cách” (You’re holding it wrong), chỉ ra rằng Anthropic chính họ đã đặt ngữ cảnh 1 triệu làm mặc định, và đã quảng bá Opus như mô hình chủ lực, nhưng hiện lại khuyên người dùng trả phí không nên dùng các tính năng đó. Anh cũng lưu ý rằng, không giống như việc OpenAI Codex trước đó gặp vấn đề tương tự đã hoàn lại hạn mức cho người dùng, Anthropic đã không thực hiện bất kỳ khoản bồi thường truy ngược nào.

Cách nói “không bị thu phí thêm” cũng trái với lịch cập nhật của chính Claude Code. Ngay trong phiên bản v2.1.90 được phát hành vào ngày hôm trước, nhóm đã sửa một bug hồi quy cache tồn tại từ v2.1.69: khi dùng --resume để khôi phục phiên hội thoại, các yêu cầu lẽ ra phải trúng cache sẽ kích hoạt một lần cache miss hoàn toàn của prompt và bị tính phí theo giá đầy đủ. Bug này kéo dài khoảng 20 phiên bản trước khi được phát hiện và sửa. Trong phản hồi của Lydia không đề cập đến ngoại lệ tính phí đã được xác nhận này.

Kể từ ngày 23 tháng 3, nhiều người dùng đăng ký Pro và Max phản ánh rằng hạn mức bất thường bị hao mòn rất nhanh. GitHub issue #41930 đã tập hợp hàng trăm báo cáo; có người dùng nói rằng hạn mức trong kế hoạch Max 5x bị dùng hết trong vòng 1 giờ, có người dùng nói rằng chỉ một câu trả lời đơn giản cũng kéo tỷ lệ sử dụng từ 59% lên 100%. Vào ngày 30 tháng 3, Anthropic từng thừa nhận trên Reddit rằng “tốc độ người dùng chạm đến hạn mức vượt xa kỳ vọng”, và cho biết đã xếp việc này vào mức ưu tiên cao nhất của đội ngũ.

Vấn đề cốt lõi của phản hồi này không nằm ở việc các chi tiết kỹ thuật có chính xác hay không, mà ở chỗ nó đẩy gần như toàn bộ trách nhiệm sang cách người dùng sử dụng. Anthropic bán gói đăng ký Pro/Max với “mô hình mạnh nhất + ngữ cảnh lớn nhất + năng lực suy luận cao nhất”, thu từ 20 đến 200 USD mỗi tháng, và bây giờ lại nói người dùng hãy tiết kiệm mà dùng.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.