OpenAI 聯合創始人聲稱 $110 億仍無法滿足需求,預訓練轉向成本聯合優化

robot
摘要生成中

根據 1M AI News 的監測,OpenAI 共同創辦人 Greg Brockman 在一次採訪中回顧了他預期在 2025 年 12 月前,AI 程式能力將出現的躍升。他使用了自己多年來一直保留的一個測試提示來衡量進展:要求 AI 建立一個網站,而在他學習程式時,完成這個網站需要他花上數個月。整個 2025 年期間,這項任務需要多次提示以及大約四小時才能完成;到 12 月時,它就能夠透過單次提示以高品質完成。他表示,新模型讓 AI 能夠把『能完成約 20% 的任務』提升到『約 80%』,這種轉變迫使每個人都必須『圍繞 AI 重新調整工作流程』。在談到這 1,100 億美元資金的配置時,Brockman 將算力比喻為『雇用銷售人員』:只要產品擁有可擴展的銷售渠道,雇用更多銷售人員就能帶來更多營收。算力不是成本中心,而是營收中心。他回憶了在 ChatGPT 發布前夕,與團隊之間的一段對話:『他們問:『我們應該買多少算力?』我說:『全部。』他們回覆:『不,不,不,認真說,我們該買多少?』我說:『不管我們怎麼做,都無法跟上需求。』這個判斷直到今天仍然成立,而算力採購需要在提前 18 到 24 個月就鎖定好。至於如何利用這些算力,Brockman 透露 OpenAI 不再只是追求最大規模的預訓練,而是改為共同最佳化預訓練能力與推論成本:『你不一定要把它做得越大越好,因為你還需要考量大量下游的推論使用案例;你真正想要的是智慧乘以成本的最優解。』然而,他堅決反對『預訓練不再重要』這種說法,認為基礎模型越聰明,後續強化學習與推論階段的效率就越高,而且『仍然存在』對 Nvidia GPU 的『絕對需求』,以支撐大規模的集中式訓練。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 留言
  • 轉發
  • 分享
留言
請輸入留言內容
請輸入留言內容
暫無留言