Andrej Karpathy опубликовал llm.c: небольшой проект в одном файле, который обучает модель уровня GPT-2 с нуля. Настоящий AI-альфа, скорее всего, не заключается в том, чтобы просто следовать за названием следующей модели, а в том, чтобы самостоятельно пройти весь цикл минимальной модели. Тот, кто поймёт, как веса обучаются шаг за шагом, в будущем быстрее разберётся с агентами, инструментами и вычислительными возможностями, чем те, кто просто заучивает релиз-ноты.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено