Claude Code v2.1.89修复长会话缓存失效,用量异常消耗问题得到回应

robot
摘要生成中

据 1M AI News 监测,Anthropic 发布 Claude Code v2.1.89(npm 包已可安装,GitHub release 页面尚未更新),修复了多个可导致 API 成本异常的缓存问题和一批稳定性 Bug。此前 Anthropic 工程师 Lydia Hallie 确认用户触达用量限制的速度「远快于预期」,社区也报告了两个可将 API 成本推高 10-20 倍的缓存 Bug。

本次更新修复的缓存相关问题包括:长会话中工具 schema 字节在会话中途变化导致 prompt cache 失效,以及嵌套 CLAUDE.md 文件在长会话中被重复注入数十次。这两个问题均会使长会话的 token 消耗远超预期。此外还修复了 StructuredOutput schema 缓存 Bug(此前导致约 50% 的工作流失败)和大 JSON 输入被 LRU 缓存键保留引发的内存泄漏。

其他值得关注的改动:

  1. 对超大文件(超过 1GB)使用 Edit 工具时不再触发 OOM 崩溃
  2. –resume 恢复会话时遇到旧版工具输出不再崩溃
  3. 触达限制时不再显示误导性的「Rate limit reached」,改为展示实际错误和操作建议
  4. thinking summaries 默认不再生成,需手动在设置中开启 showThinkingSummaries: true
  5. 新增 CLAUDE_CODE_NO_FLICKER=1 环境变量,启用无闪烁的虚拟滚动渲染
  6. 新增 PermissionDenied hook,auto 模式拒绝命令后可通过返回 {retry: true} 让模型重试
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论