Elon Musk : Le modèle de base Grok V9-Moyen (1,5T) devrait être officiellement lancé dans 2 à 3 semaines

Selon la surveillance Beating, Musk a déclaré que le modèle de base Grok V9-Medium (1,5T) a été entraîné avec succès. Les résultats de l’évaluation sont satisfaisants. Lors de l’entraînement supplémentaire, une grande quantité de données Cursor a été ajoutée, et d’autres seront encore intégrées par la suite. Le travail de fine-tuning est en cours, et l’apprentissage par renforcement sera lancé dans quelques jours. La sortie officielle est prévue dans 2 à 3 semaines. Par rapport au modèle V8-Small de 0,5T qui gère actuellement tout le flux de production de Grok, ce sera une amélioration majeure, notamment dans la gestion des tâches de codage complexes.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 7
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
GateUser-78b4adc8
· Il y a 2h
1.5T paramètres, enfin prêt à investir dans la qualité
Voir l'originalRépondre0
AirdropMileCounter
· Il y a 2h
V8-Small a soutenu la production de flux aussi longtemps, c'est du travail acharné confirmé
Voir l'originalRépondre0
GateUser-6bc62511
· Il y a 2h
Les tâches de codage complexes sont la priorité, GitHub Copilot est dangereux
Voir l'originalRépondre0
AirdropCheck-InOfficer
· Il y a 2h
La formation supplémentaire ajoute encore des données, cette vitesse d'itération est trop compétitive.
Voir l'originalRépondre0
SlothSignal
· Il y a 2h
Après le démarrage de l'apprentissage par renforcement, il semble que ce soit encore une fois une avalanche de benchmarks.
Voir l'originalRépondre0
GateUser-03ce08c7
· Il y a 2h
2-3 semaines ? Le flux temporel d'Elon n'est pas le même que celui de la Terre, n'est-ce pas ?
Voir l'originalRépondre0
AlphaAfterTea
· Il y a 2h
Les données Cursor sont alimentées, la capacité de codage doit décoller.
Voir l'originalRépondre0
  • Épinglé