🔥SemiAnalysis Test réel : GPT-5.5 revient à la pointe, mais SWE-bench Pro est dépassé par Opus 4.7


L'institut d'analyse des semi-conducteurs et de l'IA SemiAnalysis a publié une évaluation comparative des assistants de programmation, couvrant GPT-5.5, Opus 4.7 et DeepSeek V4. GPT-5.5, basé sur le nouveau pré-entraînement nommé « Spud », est le premier modèle de programmation d'OpenAI à revenir à la pointe en six mois, les ingénieurs de SemiAnalysis commencent à alterner entre Codex et Claude Code.
Les tests montrent une division du travail : Claude excelle dans la planification de nouveaux projets, Codex est plus performant pour la correction de bugs nécessitant beaucoup de raisonnement. Mais l'article révèle que Ope…
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler