Análise reversa do código Claude revela dois bugs de cache, que podem aumentar silenciosamente o custo da API em 10-20 vezes

robot
Geração de resumo em curso

Notícias do CoinExchage, segundo a monitorização da 1M AI News, um programador reverteu por engenharia reversa o ficheiro binário de 228MB da versão de instalação independente do Claude Code através do Ghidra, um proxy MITM e o radare2, e descobriu dois bugs de cache independentes que podem aumentar os custos da API em 10-20 vezes sem que os utilizadores tenham conhecimento. A análise relacionada foi submetida ao GitHub (issue #40524), tendo sido marcada pela Anthropic como um bug de regressão e atribuída para tratamento. O primeiro bug existe no runtime Bun personalizado usado na versão de instalação independente. A cada pedido de API, o runtime procura um identificador de faturação no corpo do pedido e substitui-o, mas a lógica de substituição corresponde ao primeiro item correspondente no corpo do pedido. Se o histórico da conversa contiver exatamente essa string (por exemplo, se for discutido o mecanismo interno de faturação do Claude Code), a substituição acerta no conteúdo da mensagem em vez do prompt de sistema, fazendo com que cada pedido dispare uma reconstrução total da cache. O método de evasão temporária é mudar para executar o npx @anthropic-ai/claude-code; a versão do pacote npm não inclui essa lógica de substituição. O segundo bug afecta todos os utilizadores que retomam sessões usando --resume ou --continue, e foi introduzido a partir da v2.1.69. Ao retomar uma sessão, a posição em que são injectadas informações adicionais do sistema é diferente da de uma sessão recém-criada, o que faz com que o prefixo da cache não corresponda completamente: todo o histórico da conversa é lido da cache para ser reescrito na íntegra. As iterações seguintes retomam o funcionamento normal, mas a operação de retoma em si já gerou custos adicionais significativos, e neste momento não existe uma solução de evasão externa. O programador estima que, para uma conversa longa de cerca de 500 mil tokens, o Bug 1 consome cerca de 0.04 dólares adicionais por pedido, e o Bug 2 consome cerca de 0.15 dólares adicionais por retoma; somados, o custo por pedido único pode ultrapassar 0.20 dólares. Anteriormente, a engenheira da Anthropic Lydia Hallie já tinha confirmado que a velocidade de atingimento do limite de utilização pelos utilizadores «é muito mais rápida do que o esperado»; na secção de comentários do Reddit, vários utilizadores consideram que estes dois bugs de cache podem ser uma das principais causas do consumo anómalo de utilização.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar