廣場
最新
熱門
新聞
我的主頁
發布
羅福莉:大模型邁入後訓練時代,頂尖團隊預訓練與後訓練算力比達1:1
ME News
2026-07-02 06:59:48
關注
摘要生成中
ME News 消息,4 月 24 日(UTC+8),據 動察 Beating 監測,小米大模型團隊負責人羅福莉指出,大模型競爭已從預訓練主導的 Chat 時代,全面轉向後訓練(Post-train)主導的 Agent 時代。當前的核心賽點是「如何在 Agent 上做好強化學習(RL)的 scaling」。 這一範式轉變直接導致算力分配的重構。羅福莉透露,在 Chat 時代,用於研究、預訓練和後訓練的算力比例約為 3:5:1;而在如今的 Agent 時代,合理的算力分配比例變為 3:1:1,即預訓練與後訓練的算力投入已基本相當,目前頂尖模型團隊在這兩項的投入比例已達到 1:1。 同時,系統架構的要求也發生巨變。過去的 RL 基礎設施主要以「模型推理引擎」為核心,處理純文本演算;現在的基建必須以「Agent」為核心,支持異構集群調度,並能容忍 Agent 在複雜工作流中因各類不可控因素中斷的模糊性。 (來源:BlockBeats)
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見
聲明
。
打賞
按讚
回覆
轉發
分享
回覆
請輸入回覆內容
請輸入回覆內容
回覆
暫無回覆
熱門話題
查看更多
#
Gate股票轉倉功能上線
53.47萬 熱度
#
Circle股價重挫17%
416.44萬 熱度
#
預測世界盃葡萄牙VS克羅地亞
16.39萬 熱度
#
GateCard上線積分體系
12.02萬 熱度
#
非農數據倒計時
92.14萬 熱度
已置頂
網站地圖
羅福莉:大模型邁入後訓練時代,頂尖團隊預訓練與後訓練算力比達1:1