GPT-5.5 «9.7T параметров» пересмотрен: после исправлений осталось примерно 1.5T

robot
Генерация тезисов в процессе

币界网消息,AI研究员Lawrence Chan和Benno Sturgeon对Pine AI首席科学家李博杰的论文《不可压缩知识探针:基于事实容量估算黑盒大语言模型参数量》进行了复查。
原论文估算GPT-5.5约9.7T、Claude Opus 4.7约4.0T、O1约3.5T。
复查指出,原始数字因评分口径和题目质量被放大,尤其是「地板分」处理不当,导致模型在高难题上的表现差距被夸大。
去掉「地板分」后,拟合斜率从6.79降至3.56,r²从0.917降至0.815,90%预测区间从3.0倍扩大到5.7倍,显示误差增大。
复查还发现131道题有歧义或答案错误,占9.4%。
根据修正后的数据,GPT-5.5参数从9659B降至1458B,90%预测区间为256B到8311B,复查作者强调,1.5T不能视为GPT-5.5的真实参数量。

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить