Augment Code teste real do impacto do AGENTS.md na geração de código: o melhor equivale a uma atualização de modelo, o pior não vale a pena escrever

robot
Geração do resumo em andamento

ME News Notícias, 23 de abril (UTC+8), de acordo com o monitoramento do Beating, a empresa de ferramentas de programação AI Augment Code extraiu dezenas de versões do arquivo AGENTS.md de seu monorepo e usou o conjunto de avaliação interno AuggieBench para medir o impacto real delas na produção de agentes de codificação. A abordagem foi usar um PR de alta qualidade já mesclado como referência, fazendo o agente refazer a mesma tarefa sob duas condições: com e sem o AGENTS.md, e comparando as pontuações. A diferença foi muito maior do que o esperado. A melhor versão do AGENTS.md proporcionou uma melhoria de qualidade equivalente a trocar o modelo de Haiku por Opus, enquanto a pior versão foi até pior do que não ter nada. Além disso, o mesmo arquivo pode ter efeitos opostos em tarefas diferentes: aumentou em 25% a conformidade de uma correção de bug, mas reduziu em 30% a completude de uma funcionalidade complexa no mesmo módulo. Algumas práticas eficazes incluem: manter o arquivo principal entre 100 e 150 linhas, incluir algumas referências focadas, e em módulos médios com cerca de cem arquivos principais, gerar melhorias gerais de 10% a 15%. Escrever o fluxo em passos numerados funciona melhor; um fluxo de implantação de 6 etapas reduziu PRs com arquivos faltantes de 40% para 10%, aumentando a precisão em 25%. Usar tabelas de decisão para ajudar o agente a escolher a solução correta antes de agir também elevou a conformidade em 25%. Para proibições, é necessário oferecer alternativas; apenas escrever “não fazer” faz o agente hesitar, e mais de 15 advertências contínuas prejudicam o desempenho. O erro mais comum é ter documentação demais. Quando o agente é forçado a carregar muitas documentações de arquitetura, com dezenas de milhares de tokens, sua produção piora. Um módulo acumulou 226 documentos com mais de 2MB, e mesmo o melhor AGENTS.md não ajudou. Além disso, o AGENTS.md é o único local que o agente lê 100%, e documentos não referenciados na pasta _docs/ têm uma taxa de descoberta inferior a 10%. (Fonte: BlockBeats)

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar