Les modèles de langage à niveau d'octet (LLM) ont enfin fait des progrès sérieux, avec 1,7 milliard pouvant approcher la performance de segmentation, la guerre des vocabulaires pourrait devenir obsolète.

Voir l'original
CoinNetwork
Nous Research confirme que les avantages de la segmentation peuvent être simulés entièrement par ByteDance, permettant une percée dans les grands modèles sans segmentation
Les travaux de Nous Research indiquent que la dépendance à long terme des grands modèles de langage aux tokenizers pourrait être remplacée à l'avenir.
Les tests contrôlés avec 1,7 milliards de paramètres montrent que les bénéfices du mécanisme de segmentation peuvent être simulés au niveau brut des octets par des moyens d'ingénierie.
Les expériences démontrent qu'en améliorant le débit dans un modèle natif basé sur les octets et en injectant des frontières morphologiques, on peut réduire significativement l'écart avec un modèle de segmentation ;
Avec la même puissance de calcul, la simulation de compression augmente la quantité de traitement par étape de gradient, devenant la principale source de contribution.
En superposant des frontières de sous-mots sur les octets d'entrée, un biais d'induction à long terme qui ne divulgue pas d'informations futures a été établi.
Bien que l'effet de synergie avec un plus grand nombre de paramètres reste à vérifier, avec 1,7 milliards, les bénéfices liés à la taille du vocabulaire et à la prédiction du sous-mot suivant sont limités.
Cela offre une voie pour des grands modèles sans segmentation, en se concentrant à l'avenir sur l'augmentation du débit et l'intégration explicite de préjugés morphologiques de manière non divulguée.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé