Por que o seu agente para de funcionar após alguns minutos? Engenheiro da OpenAI: Precisa de um placar e memória externa

robot
Geração de resumo em curso

De acordo com o monitoramento da Dongcha Beating, o modo /goal do Codex permite que o Agente repita continuamente até que a tarefa seja concluída, mas isso amplifica as falhas em prompts humanos vagos. O engenheiro da OpenAI, Chris Hayduk, apontou, com base na experiência prática interna, que instruções vagas como ‘otimize o código’ podem fazer o modelo desistir cedo demais por não saber qual é o objetivo final, ou cair em um ciclo de modificações cegas. Para garantir que o Agente possa trabalhar de forma estável por dias ou até mais tempo, ele resumiu três disciplinas: - Eliminar termos qualitativos e substituí-los por listas de verificação: O modelo não consegue avaliar o que é ‘melhor’, mas pode entender ‘reduzir o tempo em 20% sem falhar nos testes’. Quando confrontado com tarefas qualitativas, como formatar artigos, ele até forneceu diretamente ao Codex uma lista de verificação em Markdown contendo 200 requisitos de formatação, transformando brutalmente tarefas abstratas em quantitativas — ‘marcar todas as caixas significa conclusão.’ - Reduzir o tempo de validação para minutos: O Agente precisa validar ações por meio de testes. Não deixe que ele rode por horas em um ambiente de produção grande; em vez disso, forneça um conjunto de dados de amostra e uma estrutura leve para tornar o ciclo de feedback o mais curto possível. - Criar três arquivos como uma ‘mente externa’: Mesmo com uma janela de contexto grande, ele perderá a memória após alguns dias de execução. Ele recomenda criar diretamente três arquivos Markdown localmente: PLAN.md (plano macro), EXPERIMENTS.md (registro de experimentos e resultados) e EXPERIMENT_NOTES.md (rascunhos de pensamento em tempo real), forçando o modelo a escrever o processo de tentativa e erro no disco rígido.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado