Não discutam mais! O nome oficial em chinês do Token já foi definido

robot
Geração de resumo em curso

问AI · 官方为何最终选择词元而非智元?

O nome em chinês de Token parece finalmente estar definido!

Hoje, o site do governo da China repassou um artigo do Diário do Povo, citando a Administração Nacional de Dados, que mostra que atingimos uma média diária de chamadas de palavras de 140 trilhões.

140 trilhões de dados é um número impressionante, mas o nome em chinês do Token por trás desta notícia é ainda mais interessante, parecendo poder acalmar a recente controvérsia na indústria sobre o nome em chinês do Token.

Isso também significa que o nome em chinês do Token foi oficialmente definido como “词元”.

Os dados divulgados pela Administração Nacional de Dados, publicados pelo Diário do Povo, e repassados pelo site do governo da China, com a dupla publicação de uma agência governamental e da mídia oficial, confirmam que o nome em chinês do Token está decidido.

O que desencadeou esta disputa de nomeação foi um artigo publicado pelo Instituto de Pesquisa da Tencent, no qual o acadêmico Yang Bin propôs a tradução “模元”. Isso gerou uma onda de reações, com várias figuras proeminentes da AI nas plataformas sociais e grupos da indústria apresentando suas próprias sugestões. Rapidamente, o nome “智元” surgiu e ganhou ampla aceitação.

O reitor da Universidade Nacional de Cingapura, professor jovem e fundador da Luchan Technology, You Yang:

“O Token em chinês chama-se ‘智元’, não sei se o fundador do ‘新智元’ veio do futuro.”

O acadêmico livre e ex-professor associado do Departamento de História da Ciência da Universidade Tsinghua, Hu Yilin:

“Realmente não é tão bom quanto ‘智元’. A unidade de um computador é o byte, e o Token é a unidade de cálculo do conhecimento humano. Token não é um conceito de cálculo genérico, é o conceito de ‘inteligência geral’, ‘智’ é mais pertinente do que ‘通’.”

O fundador da Baichuan Intelligence, Wang Xiaochuan:

“Chamar de ‘智元’ é muito bom.”

O veterano em código aberto, Chen Xu:

“Nos últimos dias foram propostas várias versões de x元, e achei que ‘智元’ realmente me tocou, atendendo aos requisitos de信达雅.”

A discussão em larga escala que se seguiu não faltou com alguns que aproveitaram a oportunidade para brincar.

Mas no final, o governo decidiu, será chamado de “词元”!

De acordo com a explicação do People’s Daily, “词元” é a menor unidade que a IA utiliza para entender a linguagem humana; a unidade segmentada do token pode ser, às vezes, uma letra, às vezes, uma palavra, e a palavra consegue abranger melhor essa gama.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar