GPT-5.5「9.7T parâmetros」 foi revisado: após correções, restam cerca de 1,5T

robot
Geração do resumo em andamento
CoinWorld消息,AI研究员Lawrence Chan和Benno Sturgeon对Pine AI首席科学家李博杰的论文《不可压缩知识探针:基于事实容量估算黑盒大语言模型参数量》进行了复查。
原论文估算GPT-5.5约9.7T、Claude Opus 4.7约4.0T、O1约3.5T。
复查指出,原始数字因评分口径和题目质量被放大,尤其是「地板分」处理不当,导致模型在高难题上的表现差距被夸大。
去掉「地板分」后,拟合斜率从6.79降至3.56,r²从0.917降至0.815,90%预测区间从3.0倍扩大到5.7倍,显示误差增大。
复查还发现131道题有歧义或答案错误,占9.4%。
根据修正后的数据,GPT-5.5参数从9659B降至1458B,90%预测区间为256B到8311B,复查作者强调,1.5T不能视为GPT-5.5的真实参数量。
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado