GPT-5.5「9,7T parâmetros」 foi revisado: após correções, restam cerca de 1,5T

robot
Geração de resumo em curso

Crónica do mundo das moedas informa que os investigadores de IA Lawrence Chan e Benno Sturgeon revisaram o artigo do cientista-chefe da Pine AI, Li Bojie, intitulado «Sonda de Conhecimento Não Compressível: Estimativa do Número de Parâmetros de Modelos de Linguagem de Caixa Preta com Base na Capacidade de Fatos».
O artigo original estimou que o GPT-5.5 tinha cerca de 9,7T, o Claude Opus 4.7 cerca de 4,0T, e o O1 cerca de 3,5T.
A revisão apontou que os números originais foram inflacionados devido à metodologia de pontuação e à qualidade das questões, especialmente pelo tratamento inadequado do «ponto de piso», o que levou a uma superestimação do desempenho do modelo em questões de alta dificuldade.
Após remover o «ponto de piso», a inclinação do ajuste caiu de 6,79 para 3,56, o r² de 0,917 para 0,815, e o intervalo de previsão de 90% aumentou de 3,0 vezes para 5,7 vezes, indicando maior erro.
A revisão também descobriu que 131 questões continham ambiguidade ou respostas incorretas, representando 9,4%.
Com os dados corrigidos, o número de parâmetros do GPT-5.5 caiu de 9659B para 1458B, com um intervalo de previsão de 90% de 256B a 8311B, e os autores da revisão enfatizaram que 1,5T não deve ser considerado o número real de parâmetros do GPT-5.5.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar