Arrêtez de vous disputer ! Le nom chinois du Token a été officiellement décidé.

robot
Création du résumé en cours

Demandez à l’IA · Pourquoi l’instance officielle a finalement choisi « token » plutôt que « apprenant » ?

Le nom chinois de Token, il semble que cela soit enfin tranché !

Aujourd’hui, le site officiel du gouvernement chinois a relayé un article du Quotidien du Peuple, citant un papier de la Commission nationale des données, indiquant que notre volume d’appels quotidiens de « token » dépasse 140 000 milliards.

140 000 milliards de données, c’est énorme, mais ce qui est encore plus intéressant, c’est l’appellation chinoise de Token derrière cette actualité : elle semble pouvoir apaiser les controverses récentes de l’industrie au sujet du nom chinois de Token.

Cela signifie donc que le nom chinois de Token a été officiellement fixé à « 词元 ».

Selon les données publiées par la Commission nationale des données, relayées par le Quotidien du Peuple et transmises par le site officiel du gouvernement chinois : double publication, à la fois de la part d’un organisme officiel et d’un média officiel. Le nom chinois de Token est, en gros, réglé.

Ce qui a déclenché cette vague de controverse sur le nom, c’est le nom « 模元 », proposé par le chercheur Yang Bin dans un article publié par le Centre de recherche de Tencent. Un débat a déclenché mille vagues : diverses figures majeures de l’IA ont rapidement donné leurs propres réponses sur les réseaux sociaux et dans les groupes de l’industrie. Très vite, le nom « 智元 » est apparu à l’écran, et a rapidement obtenu un large consensus.

Yuyong, professeur jeune et doyen de l’Université nationale de Singapour, et fondateur de la société Luzhen Technology :

« En chinois, Token s’appelle “智元” ; je ne sais pas si le fondateur de “新智元” vient du futur ou a voyagé dans le temps. »

L’érudit indépendant, ancien professeur adjoint au département d’histoire des sciences de l’Université Tsinghua, Hu Yilin :

« Ce n’est vraiment pas “智元” ? L’unité d’un ordinateur, c’est l’octet ; Token est l’unité de calcul de la sagesse humaine. Token n’est pas une notion de calcul général : c’est une notion d’“intelligence générale”. Le “智” est plus ciblé que le “通”, et plus pertinent. »

Wang Xiaochuan, fondateur de Baichuan Intelligence :

« “智元”, ça va très bien. »

Chen Xu, membre expérimenté de l’open source :

« Ces jours-ci, on a proposé toutes sortes de “x yuan”, et je trouve que “智元” arrive à me convaincre, ce qui correspond aux exigences de Xin-Da-Ya. »

À partir de là, un vaste débat s’est déclenché, et il n’y a pas que des commentateurs sérieux : il y a aussi des participants qui se lancent dans des plaisanteries.

Mais au final, l’instance officielle a tranché : on appellera cela « 词元 » !

D’après l’explication de Renminwang : « 词元 » est l’unité minimale permettant à l’IA de comprendre le langage humain. Les unités découpées par token sont parfois des caractères, parfois des mots, et les mots peuvent mieux couvrir ce champ.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler