Чому ваш агент припиняє працювати через кілька хвилин? Інженер OpenAI: Йому потрібна таблиця результатів і зовнішня пам’ять

robot
Генерація анотацій у процесі

Згідно з моніторингом Dongcha Beating, режим /goal Codex дозволяє Агенту циклічно повторювати дії, поки завдання не буде виконано, але це підсилює недоліки нечітких людських підказок. Інженер OpenAI Кріс Хайдюк зазначив з внутрішнього практичного досвіду, що нечіткі інструкції, такі як «оптимізувати код», можуть спричинити передчасне зупинення моделі через незнання кінцевої точки або потрапляння у сліпий цикл модифікацій. Щоб забезпечити стабільну роботу Агенту протягом днів або навіть довше, він узагальнив три дисципліни: - Усунути якісні терміни та замінити їх на чеклісти: модель не може оцінити, що є «кращим», але може зрозуміти «зменшити час на 20% без провалу тестів». При роботі з якісними завданнями, наприклад форматуванням документів, він навіть безпосередньо надавав Codex чекліст у Markdown з 200 вимогами до форматування, жорстко перетворюючи абстрактні завдання у кількісні — «завершення всіх чекбоксів означає завершення». - Скоротити час перевірки до хвилин: Агенту потрібно перевіряти дії через тестування. Не дозволяйте йому працювати годинами у великому виробничому середовищі; натомість, надайте йому зразковий набір даних і легкий каркас для максимально швидкого зворотного зв’язку. - Створити три файли як «зовнішній мозок»: Навіть із великим вікном контексту, він втратить пам’ять через кілька днів роботи. Він рекомендує безпосередньо створити три Markdown-файли локально: PLAN.md (макроплан), EXPERIMENTS.md (запис експериментів та результатів), і EXPERIMENT_NOTES.md (чернетки думок у реальному часі), змушуючи модель записувати процес проб і помилок на жорсткий диск.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено