廣場
最新
熱門
新聞
我的主頁
發布
前字節Seed工程師:字節一輪迭代要半年,谷歌傳聞只需三個月
ME News
2026-07-03 13:57:03
關注
摘要生成中
ME News 消息,4 月 24 日(UTC+8),據 動察 Beating 監測,前字節跳動 Seed 團隊工程師、現北京大學助理教授張馳在播客《Into Asia》中透露,字節跳動完成一輪大模型訓練(預訓練加後訓練)需要約半年,而谷歌據傳聞只需三個月。他認為迭代速度是中國公司追趕困難的核心原因之一。張馳在字節約一年,所在的數學團隊偏研究性質,他自述該組的定位「更多是為了宣傳」,與負責模型交付的預訓練和後訓練團隊不同。 張馳描述了 Seed 內部的 benchmaxxing(刷分)文化:團隊領導按負責的 benchmark 評估績效,所有人都在衝分數,「但這不能轉化為實際使用中的好體驗」。他說紙面上中國大公司的模型都能追平美國前沿模型,但實際用起來「不夠好」。Seed 的目標是全球頂尖,「但很遺憾,我不認為我們追上了」,即使是國內第一的目標「也沒有實現」。2024 年底 Seed 自認追平 GPT-4o,隨後 DeepSeek 發布,團隊意識到差距仍在,他加入時全組正緊急轉向強化學習。 (來源:BlockBeats)
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見
聲明
。
打賞
按讚
回覆
轉發
分享
回覆
請輸入回覆內容
請輸入回覆內容
回覆
暫無回覆
熱門話題
查看更多
#
gStocks代幣化股票上線
106.42萬 熱度
#
非農爆冷打壓加息預期
103.58萬 熱度
#
預測世界盃葡萄牙VS克羅地亞
18.94萬 熱度
#
ETH突破1700
1.2億 熱度
#
Meta賣算力引發存儲股大跌
139.24萬 熱度
已置頂
網站地圖
前字節Seed工程師:字節一輪迭代要半年,谷歌傳聞只需三個月