2026-04-08 10:41:05

Recentemente fiz uma batalha entre múltiplos modelos e descobri algo bastante interessante.

Para o mesmo problema de arquitetura, pedi ao Claude e ao Codex que escrevessem soluções independentemente.
O Codex deixou passar um detalhe: minha estratégia está dispersa em mais de 20 processos independentes, e a sua solução assumia que "todos os componentes estão no mesmo local", o que não funciona. O Claude percebeu isso de imediato.
Por outro lado, o Claude deixou passar outro detalhe: insistia em criar módulos independentes, mas na verdade já tenho um framework completo pronto para usar, bastando adicionar um campo. O Codex conseguiu recuperar essa ideia.
O mais interessante foi a etapa seguinte: pedi aos dois modelos que revisassem a solução final um do outro, e ambos inconscientemente assumiram que o outro já tinha escrito a estrutura completa, o que levou a uma omissão de uma situação limite — só descobri isso ao rodar manualmente os dados de produção.
Portanto, minha nova rotina é: em cada rodada de batalha, definir critérios de sucesso independentes e impedir que um modelo veja o rascunho do outro. Assim, recebo duas versões com áreas de blindagem diferentes, que ao serem combinadas se aproximam de uma solução completa.

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.

2 gostos