Augment Code реальне тестування впливу AGENTS.md на генерацію коду: найкращий еквівалентний підвищенню моделі на один рівень, найгірший — гірше, ніж без написання.

robot
Генерація анотацій у процесі
ME News повідомлення, 23 квітня (UTC+8), за даними моніторингу Beating, компанія з інструментів AI-програмування Augment Code витягнула десятки файлів AGENTS.md з власного monorepo та використала внутрішній оцінювальний набір AuggieBench для вимірювання їхнього фактичного впливу на результати кодувального агента. Метод полягає в тому, щоб взяти вже об’єднані високоякісні PR як еталон, змусити агента виконати те саме завдання за двох умов — з AGENTS.md та без — і порівняти оцінки. Різниця виявилася набагато більшою, ніж очікувалося. Найкраще написані AGENTS.md підвищують якість так само, як заміна моделі з Haiku на Opus, а найгірші — навіть гірші, ніж їх повна відсутність. Більше того, один і той самий файл може мати протилежний ефект для різних завдань: він підвищив відповідність стандартам у виправленні багу на 25%, але знизив завершеність складного функціоналу того ж модуля на 30%. Є кілька ефективних прийомів: основний файл — 100–150 рядків, кілька фокусних довідкових документів у середньому модулі з сотнею ключових файлів дають загальне підвищення на 10–15%. Найкраще працює оформлення процесу як нумерованих кроків: 6-кроковий процес розгортання скоротив PR із пропущеними файлами з 40% до 10%, а точність зросла на 25%. Використання таблиць рішень, щоб агент обирав правильний підхід перед дією, підвищило відповідність стандартам на 25%. Заборони обов’язково мають супроводжуватися альтернативами; саме «не роби» змушує агента вагатися, а більше 15 послідовних попереджень значно погіршує результат. Найчастіше проблема виникає через надто багато документації. Коли агент занурюється в масу архітектурної документації, після завантаження сотень тисяч токенів результат погіршується. В одному модулі накопичилося 226 документів обсягом понад 2 МБ, і навіть найкращі AGENTS.md не допомогли. Крім того, AGENTS.md — це єдине місце документації, яке агент читає на 100%; документи в _docs/, на які немає посилань, знаходять менш ніж у 10% випадків. (Джерело: BlockBeats)
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено