Andrej Karpathy 发了 llm.c:一个单文件小项目,从 0 训练 GPT-2 级别模型。真正的 AI alpha 大概率不是追下一个模型名,是把模型最小闭环亲手跑一遍。看懂 weights 怎么一步步训出来的人,后面看 agent、tooling、compute 机会,会比只背 release note 的小可爱早半拍。

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论