广场
最新
热门
资讯
我的主页
发布
前字节Seed工程师:字节一轮迭代要半年,谷歌传闻只需三个月
ME News
2026-07-03 13:57:03
关注
摘要生成中
ME News 消息,4 月 24 日(UTC+8),据 动察 Beating 监测,前字节跳动 Seed 团队工程师、现北京大学助理教授张驰在播客《Into Asia》中透露,字节跳动完成一轮大模型训练(预训练加后训练)需要约半年,而谷歌据传闻只需三个月。他认为迭代速度是中国公司追赶困难的核心原因之一。张驰在字节约一年,所在的数学团队偏研究性质,他自述该组的定位「更多是为了宣传」,与负责模型交付的预训练和后训练团队不同。 张驰描述了 Seed 内部的 benchmaxxing(刷分)文化:团队领导按负责的 benchmark 评估绩效,所有人都在冲分数,「但这不能转化为实际使用中的好体验」。他说纸面上中国大公司的模型都能追平美国前沿模型,但实际用起来「不够好」。Seed 的目标是全球顶尖,「但很遗憾,我不认为我们追上了」,即使是国内第一的目标「也没有实现」。2024 年底 Seed 自认追平 GPT-4o,随后 DeepSeek 发布,团队意识到差距仍在,他加入时全组正紧急转向强化学习。 (来源:BlockBeats)
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见
声明
。
赞赏
点赞
评论
转发
分享
评论
请输入评论内容
请输入评论内容
评论
暂无评论
热门话题
查看更多
#
gStocks代币化股票上线
106.38万 热度
#
非农爆冷打压加息预期
103.6万 热度
#
预测世界杯阿根廷VS佛得角
19.13万 热度
#
ETH突破1700
1.2亿 热度
#
Meta卖算力引发存储股大跌
139.21万 热度
置顶
网站地图
前字节Seed工程师:字节一轮迭代要半年,谷歌传闻只需三个月