Meituan LongCat-2.0-Preview se lance discrètement : pas d'annonce, pas de code source ouvert

robot
Création du résumé en cours

AIMPACT message, le 28 avril (UTC+8), avec plus de détails : ce modèle dépasse un billion de paramètres, utilise une architecture MoE, supporte une fenêtre de contexte d’environ 1 million, le nombre de paramètres est essentiellement le même que celui du DeepSeek V4 publié le même jour. Selon des sources informées, l’entraînement et l’inférence de LongCat-2.0-Preview ont été entièrement réalisés sur une infrastructure de calcul nationale, mobilisant entre 50 000 et 60 000 cartes d’accélération domestiques, ce qui constitue la plus grande tâche d’entraînement jamais réalisée avec une puissance de calcul nationale. Pendant la période de test, une limite gratuite de 10 millions de tokens par jour a été fournie. (Source : BlockBeats)

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler