Andrej Karpathy enviou o llm.c: um projeto pequeno de arquivo único, treinando um modelo do nível GPT-2 do zero. A verdadeira inteligência artificial alpha provavelmente não é apenas seguir o próximo nome de modelo, mas executar manualmente o ciclo completo do modelo. Quem entende como os pesos são treinados passo a passo, no futuro, ao olhar para agentes, ferramentas e oportunidades de computação, vai entender muito mais rápido do que aqueles que apenas memorizam as notas de lançamento.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado