Elon Musk : La différence entre Grok V9 et V8 est énorme, la version d'entraînement de V9 affiche déjà de meilleures performances

robot
Création du résumé en cours
AIMPACT message, 15 mai (UTC+8), Elon Musk a publié sur la plateforme X qu'il a récemment terminé l'entraînement de Grok V9 (1,5T paramètres) "très performant", et que ce résultat n'a pas encore été inclus dans la partie d'entraînement supplémentaire des données Cursor. La version du modèle de base en développement interne est V9, avec environ 1,5 trillion de paramètres, une amélioration significative par rapport à V8 en termes de nettoyage des données, de méthodes d'entraînement et de taille du modèle, et a été optimisée pour l'architecture Blackwell afin d'améliorer l'efficacité de l'utilisation de la puissance de calcul. Musk a souligné qu'en comparaison, la version externe actuelle v4.2 est construite sur le modèle de base V8, avec environ 0,5T paramètres, fonctionnant sur l'architecture Hopper, et présente encore certaines limitations en termes de qualité et de couverture des données d'entraînement. La différence de performance entre Grok V8 et V9 est énorme, la nouvelle génération de modèles ayant réalisé une avancée spectaculaire dans ses capacités globales. (Source : ODAILY)
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 7
  • 1
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
SudoSage
· Il y a 2h
Le terme « montée en puissance rapide » sorti de la bouche de Musk signifie généralement qu'il y a vraiment quelque chose derrière.
Voir l'originalRépondre0
YieldKaraoke
· Il y a 3h
À l'extérieur, Hopper est toujours en cours, à l'intérieur, c'est déjà Blackwell, la différence d'information est bien comprise
Voir l'originalRépondre0
GateUser-53a6e1a8
· Il y a 4h
Le nettoyage des données est enfin pris au sérieux, auparavant la qualité des réponses de Grok était effectivement irrégulière.
Voir l'originalRépondre0
Don'tCallMeABagHolder.
· Il y a 4h
L'optimisation de l'architecture Blackwell est essentielle, l'amélioration de l'efficacité de la puissance de calcul détermine directement la rentabilité.
Voir l'originalRépondre0
LimeLeverageAlert
· Il y a 4h
Attendre une intégration de Cursor, la taille de ce paramètre en V9 est un peu absurde
Voir l'originalRépondre0
BlackVelvetBluePeony
· Il y a 4h
Les explications de l'optimisation de Blackwell montrent que Lao Huang et Musk deviennent de plus en plus liés.
Voir l'originalRépondre0
Post-RainCancellationAgent
· Il y a 4h
0.5T à 1,5T, trois fois plus de paramètres, la différence est vraiment grande
Voir l'originalRépondre0
  • Épinglé