Claude Code enfrenta uma grande crise de confiança após a atualização, com a profundidade cognitiva a diminuir 67%

robot
Geração de resumo em curso

De acordo com o acompanhamento do 1M AI News, a ferramenta de programação com IA da Anthropic, o Claude Code, está a enfrentar uma grave crise de reputação. O director de IA da AMD apresentou publicamente um relatório de problema no repositório oficial do GitHub, acusando o Claude Code de degradação sistemática de capacidades desde fevereiro deste ano, com base numa análise quantitativa de dezenas de milhares de registos de conversas. O relatório afirma que a profundidade cognitiva caiu 67% e que o comportamento do modelo se desviou significativamente. Este relatório rapidamente desencadeou discussões na comunidade de programadores, colocando a Anthropic em destaque. A análise de 6,852 registos de conversas mostra que a profundidade cognitiva mediana caiu 67%, o investimento em investigação antes da modificação do código diminuiu cerca de 70% e os casos de comportamentos negativos como evasão e terminação prematura aumentaram para 173 vezes em 17 dias. O director de IA da AMD afirmou: “O Claude já não pode ser confiado para executar tarefas complexas de engenharia”, e a sua equipa transitou para outros prestadores de serviço.

Um membro da equipa da Anthropic, Boris, respondeu que os problemas resultam da introdução do mecanismo de “pensamento adaptativo” a 9 de fevereiro e do ajuste do nível de pensamento predefinido de alto para médio a 3 de março, afirmando que não se trata de uma degradação central de capacidades do modelo e sugerindo que os utilizadores aumentem manualmente o nível de esforço para restaurar o desempenho. No entanto, numerosos programadores relataram que, mesmo quando os parâmetros estão definidos para o nível mais alto, a tendência do modelo para “se apressar a concluir tarefas” continua evidente, acreditando que a explicação oficial não aborda a essência do problema.

O relatório suscitou fortes reações na comunidade de programadores, com muitos utilizadores a afirmarem que cancelaram as suas subscrições e mudaram para ferramentas alternativas como OpenAI Codex. Entretanto, a degradação conduziu a um aumento catastrófico dos custos de API: com o volume de perguntas a manter-se estável, os custos mensais dispararam de $345 para $42,121, um aumento de 122 vezes. A análise também apontou que a funcionalidade lançada anteriormente de “ocultar conteúdo de pensamento” obscureceu objetivamente este processo de degradação, exacerbando ainda mais a desconfiança dos utilizadores.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar