Augment Code prueba real de AGENTS.md sobre el impacto en la generación de código: lo mejor equivale a una actualización del modelo en un nivel, lo peor no es mejor que no escribirlo

robot
Generación de resúmenes en curso

Noticias ME News, 23 de abril (UTC+8), según la monitorización de Dongcha Beating, la empresa de herramientas de programación AI Augment Code extrajo decenas de archivos AGENTS.md de su monorepo y los evaluó con el conjunto de pruebas internas AuggieBench para medir su impacto real en la producción de agentes de codificación. La metodología consiste en usar un PR de alta calidad ya fusionado como referencia, y hacer que el agente rehaga la misma tarea bajo dos condiciones: con y sin AGENTS.md, para comparar las puntuaciones. La diferencia es mucho mayor de lo esperado. La mejor versión de AGENTS.md aporta una mejora en calidad equivalente a cambiar el modelo de Haiku a Opus, mientras que la peor versión ni siquiera supera no tener ninguno. Además, el mismo archivo puede tener efectos opuestos en diferentes tareas: aumenta en un 25% la conformidad de un bug fix, pero reduce en un 30% la completitud de una función compleja en el mismo módulo. Hay varias prácticas efectivas: mantener el archivo principal entre 100 y 150 líneas, acompañarlo con varias referencias focalizadas, y en módulos medianos con unos cien archivos clave, puede ofrecer una mejora global del 10% al 15%. Es más efectivo si el proceso se estructura en pasos numerados: un flujo de despliegue en 6 pasos reduce los PR con archivos omitidos del 40% al 10%, y aumenta la precisión en un 25%. Utilizar tablas de decisión para que el agente elija la estrategia correcta antes de actuar también incrementa en un 25% la conformidad con las normas. Escribir prohibiciones debe ir acompañado de alternativas; solo poner “no hacer” genera dudas en el agente y, tras más de 15 advertencias consecutivas, la efectividad se deteriora notablemente. Lo más fácil de fallar es tener demasiada documentación. Cuando el agente se ve obligado a procesar una gran cantidad de documentación arquitectónica, cargando decenas de miles de tokens, su rendimiento empeora. Un módulo acumuló 226 documentos que superan los 2MB, y por muy buena que sea AGENTS.md, no sirvió de mucho. Además, AGENTS.md es el único documento que el agente lee al 100%, y la tasa de descubrimiento de documentos no referenciados en _docs/ es inferior al 10%. (Fuente: BlockBeats)

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado