Opus 4.6/4.7 mejora las deficiencias matemáticas hasta igualarlas con las habilidades de codificación, este indicador ECI es interesante— mide la dificultad relativa entre modelos, no en comparación con los humanos, así que no confundas con «superar a los matemáticos humanos»

Ver original
MeNews
Epoch AI lanza el mapa de especialización de Claude: la habilidad de programar sigue siendo fuerte, Opus 4.6 y 4.7 ya han compensado las deficiencias en matemáticas
El análisis del índice de capacidades específicas del dominio de Epoch AI muestra que la serie Claude ha liderado a largo plazo en la escritura de código, pero tiene habilidades matemáticas relativamente débiles; los datos más recientes indican que esta disparidad se está reduciendo rápidamente. Anteriormente, Claude tenía una puntuación en SWE-ECI superior a la puntuación general, y existía una brecha en Math-ECI, pero Opus 4.6/4.7 las redujo a menos de 1 punto, cubriendo las deficiencias. El ECI refleja la dificultad relativa de las tareas entre modelos, no la dificultad para los humanos.
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado