Andrej Karpathy a publié llm.c : un petit projet en un seul fichier, entraînant un modèle de niveau GPT-2 à partir de zéro. Le véritable alpha de l'IA n'est probablement pas de poursuivre le prochain nom de modèle, mais de faire fonctionner soi-même la boucle fermée la plus petite du modèle. Ceux qui comprennent comment les poids sont entraînés étape par étape, auront une avance sur ceux qui se contentent de lire les notes de version lorsqu'ils examineront les agents, les outils et les opportunités de calcul.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé