Augment Code prueba real del impacto de AGENTS.md en la generación de código: lo mejor equivale a mejorar el modelo un nivel, lo peor es peor que no escribirlo.

robot
Generación de resúmenes en curso
ME News Noticias, 23 de abril (UTC+8), según el monitoreo de Dongcha Beating, la empresa de herramientas de programación AI Augment Code extrajo docenas de AGENTS.md de su propio monorepo y utilizó su conjunto de evaluación interna AuggieBench para medir su impacto real en la producción de agentes de codificación. El método consistió en tomar PRs de alta calidad ya fusionados como referencia, y hacer que el agente rehiciera la misma tarea con y sin AGENTS.md, comparando las puntuaciones. La diferencia fue mucho mayor de lo esperado. Los AGENTS.md mejor escritos lograron una mejora de calidad equivalente a cambiar el modelo de Haiku a Opus, mientras que los peor escritos fueron peores que no tener ninguno. Además, el mismo documento podía tener efectos opuestos en diferentes tareas: aumentó la conformidad con las normas en un 25% para una corrección de errores, pero redujo la finalización de una función compleja en el mismo módulo en un 30%. Las prácticas efectivas incluyen: mantener el archivo principal entre 100 y 150 líneas, acompañarlo de unos pocos documentos de referencia enfocados, lo que en módulos medianos con alrededor de cien archivos centrales logra una mejora general del 10% al 15%. El formato de pasos numerados es el más efectivo; un flujo de despliegue de 6 pasos redujo los PRs con archivos faltantes del 40% al 10%, y aumentó la precisión en un 25%. Usar tablas de decisión para ayudar al agente a elegir el plan correcto antes de actuar también aumentó la conformidad con las normas en un 25%. Las prohibiciones deben ir acompañadas de alternativas; escribir solo "no" hace que el agente dude, y más de 15 advertencias consecutivas empeoran notablemente el rendimiento. El mayor riesgo es el exceso de documentación. Una vez que el agente se ve arrastrado a una gran cantidad de documentos de arquitectura, cargar cientos de miles de tokens empeora la producción. Un módulo acumuló 226 documentos de más de 2 MB, y ni los mejores AGENTS.md sirvieron. Además, AGENTS.md es el único lugar de documentación que el agente lee al 100%; los documentos bajo _docs/ que no son referenciados tienen una tasa de descubrimiento inferior al 10%. (Fuente: Dongcha Beating)
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios