Augment Code фактично перевірив вплив AGENTS.md на генерацію коду: найкращий результат еквівалентний підвищенню моделі на один рівень, найгірший — гірше, ніж без написання.

robot
Генерація анотацій у процесі
ME News повідомляє, 23 квітня (UTC+8), за даними моніторингу Dongcha Beating, компанія з інструментів AI-програмування Augment Code витягла десятки файлів AGENTS.md з власного monorepo та використала внутрішній набір для оцінки AuggieBench, щоб виміряти їхній фактичний вплив на результати кодувальних агентів. Метод полягав у тому, щоб взяти вже об'єднані високоякісні PR як базову лінію, змусити агента виконати те саме завдання в умовах наявності та відсутності AGENTS.md, і порівняти бали. Різниця виявилася набагато більшою, ніж очікувалося. Найкраще написаний AGENTS.md підвищив якість так само, як заміна моделі з Haiku на Opus, а найгірший був навіть гірший, ніж його відсутність. Більше того, один і той самий файл міг мати протилежні ефекти на різні завдання: він підвищив відповідність специфікаціям при виправленні помилки на 25%, але знизив завершеність складного функціоналу в тому ж модулі на 30%. Існує кілька ефективних правил написання: основний файл має бути обмежений 100-150 рядками, у поєднанні з кількома сфокусованими довідковими документами, що може забезпечити загальне підвищення на 10-15% у модулях середнього розміру з сотнями основних файлів. Найкращий ефект дає оформлення процесу у вигляді нумерованих кроків: один 6-кроковий процес розгортання знизив частку PR із пропущеними файлами з 40% до 10%, а точність підвищилася на 25%. Використання таблиці рішень, щоб допомогти агенту вибрати правильний підхід перед початком роботи, також підвищило відповідність специфікаціям на 25%. Заборони обов'язково повинні супроводжуватися альтернативами; просте написання «не роби» змушує агента вагатися, а більше 15 попереджень поспіль значно погіршує ефект. Найчастіше проблеми виникають через надмірну кількість документації. Коли агент потрапляє в велику архітектурну документацію, завантажуючи сотні тисяч токенів, результати погіршуються. В одному модулі накопичили 226 документів загальним обсягом понад 2 МБ, і навіть хороший AGENTS.md не допоміг. Крім того, AGENTS.md є єдиним місцем документації, яке агент читає на 100%; документи в _docs/, на які немає посилань, виявляються менш ніж у 10% випадків. (Джерело: BlockBeats)
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено