Test ouvert du modèle à un trillion de paramètres de Meituan, l'ensemble de l'entraînement a été réalisé par un cluster de calcul national.

robot
Création du résumé en cours
AIMPACT Nouvelles, 24 avril (UTC+8), selon des sources industrielles, le nouveau modèle de base de Meituan, LongCat-2.0-Preview, est désormais ouvert aux tests. Ce modèle dépasse les mille milliards de paramètres, se hissant ainsi au rang des meilleurs modèles mondiaux. Selon des initiés, le nouveau modèle V4 de DeepSeek, publié le même jour, a un nombre total de paramètres et un nombre de paramètres activés quasiment identiques à ceux de LongCat-2.0-Preview de Meituan. Outre l'échelle des paramètres, la plus grande avancée du nouveau modèle de base de Meituan réside dans le fait que l'ensemble du processus d'entraînement et d'inférence repose sur un cluster de calcul national. D'après les mêmes sources, le nombre de cartes de calcul utilisées par Meituan lors de cette phase d'entraînement se situe entre 50 000 et 60 000, ce qui constitue jusqu'à présent la plus grande tâche d'entraînement de modèle jamais réalisée sur des infrastructures de calcul nationales. (Interface) (Source : BlockBeats)
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé