Andrej Karpathy 发表了 llm.c:一个单文件的小项目,从零开始训练 GPT-2 级别的模型。真正的 AI alpha 很可能不是追逐下一个模型名字,而是亲手跑一遍模型的最小闭环。理解 weights 是如何一步步训练出来的人,之后在看 agent、tooling、compute 机会时,会比只背诵 release note 的小可爱早半拍。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン留め