Meituan lance un test ouvert pour le modèle à un trillion de paramètres alimenté par des clusters informatiques domestiques

Le 24 avril, des sources de l’industrie ont rapporté que le modèle fondamental de nouvelle génération de Meituan, LongCat-2.0-Preview, a été ouvert aux tests, dépassant une échelle de paramètres totale d’un billion, le plaçant parmi les grands modèles mondiaux. Selon des initiés, DeepSeek a également publié son modèle V4 de nouvelle génération le même jour, qui possède un nombre total de paramètres et un nombre de paramètres actifs largement cohérents avec ceux de LongCat-2.0-Preview de Meituan. Au-delà de l’échelle des paramètres, une avancée significative du nouveau modèle fondamental de Meituan réside dans le fait que sa formation et son inférence sont entièrement prises en charge par des clusters informatiques domestiques. Les sources ont indiqué que le nombre de cartes de calcul utilisées lors de cette phase de formation variait entre 50 000 et 60 000, marquant la plus grande tâche de formation de grand modèle réalisée à ce jour avec des ressources informatiques domestiques. (Source : Jiemian)

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler