Opus 4.6/4.7 compensa as deficiências matemáticas para ficar ao nível da capacidade de codificação, o indicador ECI é interessante — mede a dificuldade relativa entre os modelos, não em comparação com humanos, então não confunda com "superar matemáticos humanos"

Ver original
MeNews
Epoch AI lança o mapa de especialização do Claude: a vantagem na escrita de código permanece, Opus 4.6 e 4.7 já preencheram as lacunas em matemática
A análise do índice de capacidade específica de domínio do Epoch AI mostra que a série Claude lidera há muito tempo na escrita de código, mas tem uma capacidade matemática relativamente fraca; os dados mais recentes indicam que essa disparidade está sendo rapidamente reduzida. Anteriormente, Claude tinha uma pontuação de SWE-ECI superior à pontuação geral, com uma diferença em Math-ECI, mas o Opus 4.6/4.7 reduziu ambas para dentro de 1 ponto, preenchendo as lacunas. O ECI reflete a dificuldade relativa da tarefa entre os modelos, e não a dificuldade para os humanos.
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado