斯坦福这结论挺扎心:开放权重只是起点,数据壁垒才是护城河。

ME News
斯坦福NLP:多数公开智能体训练数据仍集中于后训练阶段
斯坦福NLP团队在Twitter表示,目前公开的智能体训练数据主要用于后训练阶段,尤其针对如Qwen等模型。这些模型可能已在大量智能体数据上训练过。他们认为,从头训练出优秀的开源模型所需的智能体数据量远超仅依赖开放权重进行后训练的规模,凸显预训练阶段智能体数据的不足。来源:InFoQ
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论