Почему ваш агент перестает работать через несколько минут? Инженер OpenAI: ему нужна доска результатов и внешняя память

robot
Генерация тезисов в процессе

Согласно мониторингу Dongcha Beating, режим /goal у Codex позволяет Агенту циклически повторять действия, пока задача не будет выполнена, но это усиливает недостатки расплывчатых человеческих подсказок. Инженер OpenAI Крис Хайдюк отметил на основе внутреннего практического опыта, что расплывчатые инструкции, такие как «оптимизировать код», могут привести к тому, что модель сдается слишком рано из-за незнания конечной точки или застревает в слепом цикле модификаций. Чтобы обеспечить стабильную работу Агента в течение нескольких дней или даже дольше, он выделил три дисциплины:

  • Удалить качественные термины и заменить их контрольными списками: модель не может оценить, что «лучше», но она может понять «сократить время на 20% без провала тестов». При выполнении качественных задач, таких как форматирование документов, он даже напрямую предоставил Codex контрольный список в Markdown с 200 требованиями к форматированию, жестко превращая абстрактные задачи в количественные — «отметка всех галочек означает завершение».
  • Сократить время проверки до минут: Агенту нужно проверять действия через тестирование. Не позволяйте ему работать часами в крупной производственной среде; вместо этого предоставьте ему образец данных и легковесную структуру, чтобы сделать цикл обратной связи максимально коротким.
  • Создать три файла как «внешний мозг»: даже при большом окне контекста память будет теряться после нескольких дней работы. Он рекомендует прямо создавать три файла Markdown локально: PLAN.md (макроплан), EXPERIMENTS.md (запись экспериментов и результатов), и EXPERIMENT_NOTES.md (черновики текущих мыслей), принуждая модель записывать процесс проб и ошибок на жесткий диск.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено