🔥SemiAnalysis Teste prático: GPT-5.5 retorna à vanguarda, mas o SWE-bench Pro é superado pelo Opus 4.7


A agência de análise de semicondutores e IA SemiAnalysis publicou uma avaliação comparativa de assistentes de programação, cobrindo GPT-5.5, Opus 4.7 e DeepSeek V4. GPT-5.5, baseado no novo pré-treino com o codinome «Spud», é o primeiro modelo de programação a retornar à vanguarda da OpenAI em meio ano, e os engenheiros da SemiAnalysis começaram a alternar entre Codex e Claude Code. Os testes práticos mostram uma divisão de tarefas: Claude é melhor no planejamento de novos projetos, enquanto Codex é mais forte na correção de bugs que exigem raciocínio intensivo. Mas o artigo revela que Ope…
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar