Claude Code v2.1.89 corrigiu a falha de cache em sessões longas, respondendo às questões de consumo anormal de recursos.

robot
Geração de resumo em curso

De acordo com o monitorização da 1M AI News, a Anthropic lançou o Claude Code v2.1.89 (o pacote npm já está instalável, mas a página do GitHub release ainda não foi atualizada). Esta versão corrigiu vários problemas de cache que podiam levar a custos de API anómalos e uma série de bugs de estabilidade. Anteriormente, a engenheira da Anthropic Lydia Hallie confirmou que a velocidade com que os utilizadores atingem os limites de consumo era «muito mais rápida do que o esperado»; a comunidade também reportou dois bugs de cache que conseguem elevar os custos da API em 10-20 vezes.

Nesta atualização, os problemas de cache corrigidos incluem: em conversas longas, bytes do schema das ferramentas mudam a meio da sessão, fazendo com que a prompt cache fique inválida, e ficheiros aninhados CLAUDE.md serem injetados repetidamente dezenas de vezes durante conversas longas. Estes dois problemas fazem com que o consumo de tokens em conversas longas exceda largamente o esperado. Além disso, foi corrigido um bug na cache do StructuredOutput schema (anteriormente levando a cerca de 50% de falhas de workflows) e uma fuga de memória causada pela retenção das chaves de cache do LRU ao lidar com entradas JSON grandes.

Outras alterações que valem a pena destacar:

  1. Ao usar a ferramenta Edit em ficheiros demasiado grandes (acima de 1GB) já não ocorre a falha por OOM
  2. Ao retomar uma sessão com --resume, o problema com a saída das ferramentas de versões antigas já não causa falhas
  3. Ao atingir o limite, já não é apresentado o enganador «Rate limit reached»; em vez disso, é exibido o erro real e sugestões de ação
  4. As thinking summaries deixaram de ser geradas por defeito; é preciso ativar manualmente em definições showThinkingSummaries: true
  5. Foi adicionado a variável de ambiente CLAUDE_CODE_NO_FLICKER=1, ativando a renderização virtual de scroll sem cintilação
  6. Foi adicionado um PermissionDenied hook; no modo auto, após recusar um comando, é possível fazer o modelo tentar novamente ao devolver {retry: true}
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar