GPT-5.5「9.7T參數」被複查:修正後只剩約1.5T

robot
摘要生成中
币界網消息,AI研究員Lawrence Chan和Benno Sturgeon對Pine AI首席科學家李博傑的論文《不可壓縮知識探針:基於事實容量估算黑盒大語言模型參數量》進行了復查。原論文估算GPT-5.5約9.7T、Claude Opus 4.7約4.0T、O1約3.5T。復查指出,原始數字因評分口徑和題目質量被放大,尤其是「地板分」處理不當,導致模型在高難題上的表現差距被誇大。去掉「地板分」後,擬合斜率從6.79降至3.56,r²從0.917降至0.815,90%預測區間從3.0倍擴大到5.7倍,顯示誤差增大。復查還發現131道題有歧義或答案錯誤,占9.4%。根據修正後的數據,GPT-5.5參數從9659B降至1458B,90%預測區間為256B到8311B,復查作者強調,1.5T不能視為GPT-5.5的真實參數量。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆