Anthropic responde à crise de limite do Claude Code: recomenda não usar Opus e fechar o contexto de cerca de 1 milhão, sem mencionar compensação

robot
Geração de resumo em curso

De acordo com a monitorização da 1M AI News, um membro da equipa do Anthropic Claude Code, Lydia Hallie, publicou os resultados da sua investigação sobre a polémica de limites das últimas duas semanas. A conclusão é a seguinte: nos períodos de maior procura, os limites foram de facto apertados; o consumo das sessões com contexto na ordem dos 1 milhão de tokens aumentou; «é essa a maior parte das razões que vocês sentem». Ela afirma que a equipa corrigiu alguns bugs, mas sublinha que «nenhum bug fez com que fossem cobrados valores a mais».

Em seguida, ela deu conselhos para gastar menos:

  1. Para utilizadores Pro, usar por defeito Sonnet 4.6 em vez de Opus, porque Opus consome a uma velocidade cerca de duas vezes superior
  2. Reduzir a intensidade de raciocínio ou desligar o extended thinking quando não é necessário raciocínio profundo
  3. Não retomar conversas longas que ficaram inactivas por mais de uma hora; reabrir uma nova
  4. Definir a variável de ambiente CLAUDE_CODE_AUTO_COMPACT_WINDOW=200000 para limitar o tamanho da janela de contexto

Não é mencionada qualquer forma de reinício de limites ou compensação.

O apresentador de um podcast de IA, Alex Volkov, resumiu esta resposta como «vocês estão a segurá-lo da maneira errada» (You’re holding it wrong), apontando que a Anthropic, ela própria, definiu o contexto de 1 milhão como predefinição e promoveu o Opus como modelo de topo, mas agora recomenda que os utilizadores pagantes não usem essas funcionalidades. Ele também notou que, ao contrário do que aconteceu quando o Codex da OpenAI teve problemas semelhantes e a empresa redefiniu quotas para os utilizadores, a Anthropic não fez qualquer compensação retroactiva.

A afirmação de que «não houve cobrança a mais» também entra em tensão com o registo de actualizações do próprio Claude Code. Na versão v2.1.90, publicada no dia anterior, foi corrigido um bug de regressão de cache que existia desde a v2.1.69: ao restaurar uma sessão com --resume, solicitações que deveriam atingir a cache vão despoletar um “prompt cache miss” completo, sendo facturadas ao preço total. Este bug atravessou cerca de 20 versões antes de ser descoberto e corrigido. A resposta de Lydia não menciona este problema de facturação já confirmado.

A partir de 23 de Março, muitos utilizadores Pro e Max reportaram que os limites estavam a ser esgotados de forma anormalmente rápida. A issue do GitHub #41930 reúne centenas de relatos: há utilizadores que dizem que a quota do plano Max 5x ficou esgotada em 1 hora; há utilizadores que dizem que uma resposta simples e de uma única frase fez a taxa de utilização subir de 59% para 100%. A Anthropic, em 30 de Março, reconheceu no Reddit que «a velocidade com que os utilizadores atingem os limites é muito superior ao esperado» e afirmou que isso tinha sido colocado como a máxima prioridade da equipa.

O problema central desta resposta não está em saber se os detalhes técnicos estão correctos, mas sim no facto de ela atribuir quase toda a responsabilidade ao modo como os utilizadores estão a usar o serviço. A Anthropic vende uma subscrição Pro/Max de «modelo mais potente + contexto máximo + maior capacidade de raciocínio», cobrando entre 20 e 200 dólares por mês, e agora diz aos utilizadores para pouparem.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar