NVIDIA a publié en open source le modèle AI à double tour, augmentant la vitesse de génération de texte de 2.42 fois et préservant 98.7% de la qualité d'image.

ME AI Actualité : NVIDIA lance le modèle de langage à diffusion discrète Nemotron-Labs-TwoTower, résolvant le problème de lenteur de génération token par token des grands modèles. Les poids sont open-sourcés sur Huggingface. Ce modèle réutilise les poids pré-entraînés du réseau dorsal existant, sans nécessité d'un entraînement à partir de zéro, réduisant significativement les coûts. Il adopte une architecture à deux tours de 60B, avec deux réseaux de 30B fonctionnant en parallèle et en synergie, chaque tour activant 3B paramètres et embarquant 128 modules experts routables, améliorant l'efficacité de génération. (Source : MLion)
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé