🔥SemiAnalysis Prueba en vivo: GPT-5.5 regresa a la vanguardia, pero SWE-bench Pro es superado por Opus 4.7


La organización de análisis de semiconductores y AI SemiAnalysis publica una evaluación comparativa de asistentes de programación, cubriendo GPT-5.5, Opus 4.7 y DeepSeek V4.
GPT-5.5, basado en el nuevo preentrenamiento con código en clave «Spud», es el primer modelo de programación en volver a la vanguardia en medio año por parte de OpenAI, los ingenieros de SemiAnalysis comienzan a alternar entre Codex y Claude Code.
Las pruebas muestran una división del trabajo: Claude es mejor en la planificación de nuevos proyectos, Codex es más fuerte en la reparación de errores que requieren razonamiento intensivo.
Pero el artículo revela que Ope…
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado