De "morfema" a "símbolo": La disputa sobre la comprensión fundamental de la IA detrás del nombre en chino de Token

2026-04-10 10:49:50

Recientemente, la Comisión Nacional de Nombramiento de Ciencia y Tecnología publicó un anuncio recomendando traducir “Token” en el campo de la inteligencia artificial como “词元” (símbolo o unidad de símbolo), y ponerlo a prueba socialmente. Posteriormente, el Diario del Pueblo publicó un artículo titulado “Interpretación de expertos sobre por qué el nombre en chino de token se fija como ‘词元’”, que ofrece una explicación sistemática desde una perspectiva profesional sobre esta denominación.

El texto menciona que la palabra “token” proviene del inglés antiguo tācen, que significa “símbolo” o “marca”. En modelos lingüísticos, un token es la unidad discreta mínima obtenida tras dividir el texto o codificar en bytes, que puede manifestarse en diferentes formas como palabras, subpalabras, afijos o caracteres. El modelo demuestra cierta capacidad inteligente precisamente mediante la modelación de secuencias de tokens.

Se considera que esta denominación en el sistema de argumentación de expertos cumple con los principios de univocidad, cientificidad, simplicidad y coherencia, además de tener cierta base de uso en el contexto actual del chino. Sin embargo, tras leer las interpretaciones relacionadas, he llegado a una comprensión diferente respecto a esta ruta de denominación.

Desde una perspectiva de normalización, esta propuesta tiene ventajas en comprensión y difusión a corto plazo. Pero si se examina desde dimensiones como la ontología computacional, estructura de la información, evolución multimodal y coherencia en la traducción inversa, su adaptabilidad a largo plazo aún requiere mayor verificación. En este contexto, una ruta alternativa que también merece atención —“符元”— muestra una mayor coherencia estructural y estabilidad en diferentes contextos.

一、Desajuste en la definición: no se puede sustituir “esencia” por “origen”

Opinión del artículo (Investigador del Instituto de Tecnología de la Computación de la Academia China de Ciencias): El papel inicial de “token” en la inteligencia artificial es ser la “unidad semántica básica del lenguaje”, por lo que “词元” puede reflejar mejor su esencia.

Este juicio tiene sentido en un contexto histórico, pero en el paradigma técnico actual, esta forma de pensar en esencia es una “búsqueda académica que busca una espada en el fondo del pozo”.

Desde la lógica de la definición de términos, es necesario distinguir estrictamente entre “escenario de aplicación inicial” y “atributo estructural esencial”.

Token efectivamente proviene del procesamiento del lenguaje natural (PLN), pero en la trayectoria de la evolución de la AGI, ha superado ya los límites de los modelos lingüísticos, evolucionando hacia una unidad fundamental que procesa texto, imágenes, voz e incluso señales físicas de manera unificada. En los sistemas computacionales modernos, la verdadera ontología estructural de un token es “unidad de símbolo discreto”, no una única modalidad de unidad lingüística.

Si se denomina por su “papel inicial”, entonces la computadora (Computer) debería llamarse “máquina de cálculo electrónico” (por su función original de reemplazar a los calculadores humanos); Internet debería llamarse “red militar de la Guerra Fría”. La falla fatal de esta lógica de denominación radica en que solo observa los “trabajos temporales” de la tecnología en momentos históricos específicos, ignorando su “ontología física” que trasciende las eras.

El camino histórico no equivale a la esencia. Igualmente, no podemos por el hecho de que Token se usara inicialmente para procesar texto, limitarlo permanentemente en el contexto estrecho de “palabra”.

Definir conceptos básicos usando “escenario de aplicación inicial” en realidad es sustituir la verdad ontológica de la estructura por una dependencia histórica. Aunque en las etapas tempranas de la tecnología esto pueda facilitar la comprensión, en la fase de expansión del paradigma multimodal, esta definición se vuelve rápidamente ineficaz y se convierte en una carga que obstaculiza el entendimiento. En contraste, “符元” se alinea directamente con la ontología de símbolos en el cálculo multimodal, definiendo no el “pasado” de Token, sino su “verdad”.

二、Límites de la analogía: una vez que la interpretación se convierte en definición, comienza a desviarse

Opinión del artículo (Profesor asociado del Departamento de Computación de la Universidad Tsinghua): Se puede entender como “palabra en nube”, “bolsa de palabras” y otras analogías, interpretando las unidades discretas en multimodalidad como “ampliamente palabras”.

La analogía del profesor Dong Yuxiao ayuda a la comprensión, pero no debe sustituir a la definición. Esta idea tiene cierta inspiración en la explicación, pero si se eleva a base para la denominación, puede provocar un desplazamiento conceptual en la categoría.

Desde la metodología, la función de la analogía es reducir la barrera de comprensión, mientras que la función de la definición es delimitar los límites semánticos. Cuando “palabra” se expande para cubrir bloques de imagen (parches), fragmentos de voz, representaciones vectoriales (embeddings) e incluso señales perceptivas más amplias, sus atributos lingüísticos originales se diluyen continuamente, y los límites semánticos se vuelven borrosos. Esta expansión impulsada por “analogías” puede mantener la coherencia explicativa a corto plazo, pero en la evolución a largo plazo, puede causar desplazamiento semántico.

En la capacidad de expansión multimodal, hay que tener cuidado con la transición de “analogía” a “definición”. En el contexto de la aprobación de términos, se debe distinguir entre “metáfora explicativa” y “definición ontológica”, evitando que la primera reemplace a la segunda.

Un ejemplo más directo sería: en la divulgación científica, podemos comparar una bombilla con un “sol artificial” para facilitar la comprensión; pero en un sistema de denominación científica, no se puede renombrar la unidad de corriente eléctrica “amperio” como “elemento de luz”. La primera es una expresión descriptiva, la segunda involucra un sistema de medición estricto y definiciones estandarizadas, y no deben mezclarse.

De manera similar, términos como “nube de palabras” y “bolsa de palabras” son metáforas descriptivas o estadísticas, que ayudan a entender la estructura o distribución de datos; mientras que Token, como unidad básica de medición en grandes modelos, está profundamente integrada en los sistemas de facturación de cálculo, entrenamiento de modelos y métricas académicas. Cuando su escala de uso alcanza billones de llamadas diarias, su denominación no solo cumple una función explicativa, sino que también representa un concepto fundamental con implicaciones de ingeniería y estándares. En este nivel, el término debe alinearse con su ontología, no depender de extensiones por analogía.

Si se lleva esta lógica de analogía a la denominación, en realidad se insinúa un peligro: dado que la gente ya está acostumbrada a entender Token como “palabra”, puede continuar usando esa analogía. Pero esto en realidad es una dependencia de trayectoria — usar la conveniencia del reconocimiento existente para reemplazar la corrección ontológica del concepto. En este sentido, esta denominación se asemeja más a un “romanticismo lingüístico” que a una alineación estricta con la ontología computacional.

No podemos exigir que en los motores eléctricos se hable de “caballos electrónicos” solo porque “caballos” llevan “caballos”. La analogía puede inspirar comprensión, pero no puede definir estándares.

En cambio, “符” (símbolo) como concepto más neutral, tiene la capacidad inherente de adaptarse a múltiples modalidades, sin necesidad de explicaciones adicionales para cubrir texto, imagen, voz y otras formas de información. Por ello, una denominación basada en “unidad de símbolo” en la definición se acerca más a la estructura ontológica de Token. En esta lógica, “符元” como traducción correspondiente tiene mayor coherencia conceptual y adaptabilidad a largo plazo.

三、El costo cognitivo: cuando el anclaje semántico genera malentendidos sistémicos

Opinión del artículo (opiniones de expertos combinadas): “词元” es conciso, se ajusta a la costumbre en chino, y facilita la difusión.

Este juicio tiene cierta racionalidad en la difusión, pero implica la premisa de que el público puede aceptar la analogía “palabra” en modalidad multimodal. Sin embargo, la analogía en esencia es una herramienta de pensamiento experto, no una forma natural de cognición del público general. Para los usuarios comunes, “palabra” tiene un fuerte efecto de anclaje semántico — al escuchar “palabra”, su intuición apunta inevitablemente al sistema del lenguaje, no a símbolos en otras modalidades como imágenes, sonidos o acciones. Esta ruta cognitiva no es un problema técnico, sino una estructura estable en la psicología cognitiva.

Sobre esa base, cuando “palabra” se expande a la llamada “palabra en sentido amplio”, en realidad se genera un sesgo en la percepción del usuario. La primera intuición que se forma es “palabra = unidad lingüística”, no “símbolo en modalidad multimodal”. Una vez establecido este malentendido, todas las explicaciones posteriores serán solo correcciones a una percepción ya formada, no una extensión natural del entendimiento.

Por ejemplo, cuando los medios informan “el modelo fue entrenado con 10 billones de tokens”, el público puede entender fácilmente como “leyó una gran cantidad de textos”, ignorando la presencia de muchas imágenes, voces y otros datos multimodales. Este malentendido no es un caso aislado, sino una inducción sistémica causada por el anclaje semántico del término.

En el contexto técnico, este nombramiento también puede generar fricciones en la comunicación interdisciplinaria. Cuando en modelos visuales o de voz se llaman “tokens” a unidades discretas, no solo puede inducir malentendidos semánticos, sino también crear conflictos lingüísticos innecesarios entre diferentes campos. Los sistemas multimodales necesitan una “capa de símbolos” unificada, no una expansión del concepto en la categoría del lenguaje.

En comparación, “符” (símbolo) como concepto más abstracto, aunque requiere un umbral de comprensión inicial algo mayor, apunta a un significado más neutral, sin preconcepciones lingüísticas. A largo plazo, esto favorece la construcción de un marco cognitivo estable y unificado, reduciendo el costo interpretativo general y proporcionando una base cognitiva más estable para la unificación multimodal.

El costo del nombramiento no ocurre en la definición, sino en la corrección posterior; una vez que un nombre se ancla semánticamente en una etapa temprana, el costo de su corrección crece exponencialmente.

Los expertos pueden ampliar analógicamente los límites de “palabra”, pero el público no entenderá los conceptos por analogía. La denominación no es solo para los expertos, sino que debe responder al sistema cognitivo de toda la era.

四、La ilusión de univocidad: cuando una palabra intenta soportar dos sistemas

Opinión del artículo (principios de aprobación de términos): “词元” cumple con el principio de univocidad, ayudando a resolver la confusión en las traducciones.

En cuanto a la univocidad de los términos, hay que prestar atención especial a los riesgos sistémicos que puede generar la doble interpretación. En la aprobación de términos científicos, la “univocidad” es uno de los principios básicos. Si un término requiere contexto o explicaciones adicionales para distinguir significados, su valor como componente estándar ya se pierde.

Sin embargo, desde la perspectiva del sistema académico actual, esta evaluación aún tiene espacio para discusión. La palabra “词元” en lingüística y PLN ya tiene un uso “famoso”, y en la lingüística clásica su concepto en inglés es Lemma, que significa la forma canónica de una palabra (por ejemplo, la forma canónica de is/am/are es be). Este uso ha formado un consenso estable en los manuales y artículos académicos.

En este contexto, si también traducimos “Token” como “词元”, puede generar conflictos semánticos en la expresión concreta, con resultados desastrosos.

Por ejemplo, en la descripción de “lemmatize a token” en PLN, la expresión en chino sería “对‘词元’进行‘词元化’”, lo que no solo aumenta la dificultad de comprensión, sino que también introduce ambigüedad en la escritura académica y en la recuperación de información, dificultando distinguir si “词元” se refiere a la unidad discreta segmentada o a la forma canónica de la palabra.

Desde la función conceptual, también hay una diferenciación clara: Lemma enfatiza la “reducir” en el nivel del lenguaje, correspondiendo a la forma canónica después de la variación; mientras que Token enfatiza la “segmentación” en el proceso computacional, correspondiendo a la unidad mínima discreta en el procesamiento del modelo. Esta diferencia entre “reducir” y “segmentar” corresponde a diferentes dimensiones semánticas y de símbolos.

Por lo tanto, cuando un término necesita ser “ampliado” para cubrir múltiples conceptos existentes, su univocidad en realidad se convierte en “unificación interpretativa”, no en “estabilidad semántica”.

Cuando un término necesita explicarse para mantener la unidad, su estabilidad como término estándar comienza a tambalearse.

En cambio, “符元” en los sistemas terminológicos existentes no presenta conflicto semántico. Por un lado, mantiene la propiedad ontológica de Token como símbolo discreto; por otro, evita la superposición con la denominación ya establecida de Lemma, logrando mayor claridad semántica y estabilidad en el sistema.

五、Regreso a la ontología: Token es esencialmente “símbolo”, no “palabra”

Opinión (explicación general): Token es la unidad mínima en modelos lingüísticos para procesar texto.

Esta afirmación es válida en términos funcionales, pero aún se queda en el nivel de “cómo usar”, sin tocar la propiedad ontológica en la teoría computacional. Desde la perspectiva de la teoría de la información y la computación, el objeto básico que procesa un sistema no es “palabra”, sino “símbolo” (symbol).

Este punto puede entenderse en dos niveles:

Por un lado, desde la visión de la teoría de la información, la esencia de la información radica en eliminar la incertidumbre, y la unidad de medida es el bit, cuyo soporte es un símbolo discreto. El símbolo en sí no se preocupa por el contenido semántico, sino que está relacionado con distribuciones de probabilidad y estructuras de codificación.

Por otro lado, en la implementación computacional, los grandes modelos no “reconocen caracteres”, sino que trabajan con representaciones indexadas discretas (ID). Independientemente de si ese ID corresponde a un carácter chino, un bloque de imagen o una muestra de audio, en el proceso de cálculo se trata como un símbolo unificado.

En este marco, la propiedad ontológica de Token está en el “nivel de símbolo”, no en el “nivel de semántica”. Los símbolos en sí no llevan significado, sino que sirven como portadores básicos de codificación y cálculo.

Nombrar a Token como “palabra en sentido amplio” introduce implícitamente una referencia semántica en el nivel del lenguaje, que en realidad reubica este concepto del nivel de símbolo al nivel del lenguaje. Aunque esta denominación puede ofrecer intuición en la explicación, en el nivel teórico puede difuminar los límites entre “cálculo simbólico” y “comprensión semántica”.

En cambio, “符元” mantiene el concepto en el nivel de símbolo. Por un lado, refleja con precisión la propiedad ontológica de Token como símbolo discreto; por otro, evita la superposición con la denominación de Lemma, logrando mayor claridad y coherencia en el sistema conceptual.

Desde una perspectiva más amplia, a medida que los sistemas de inteligencia artificial avanzan hacia multimodalidad y inteligencia general, una denominación que se alinee directamente con su ontología matemática y computacional será más útil para construir un sistema cognitivo estable y escalable. En este sentido, una ruta de denominación basada en “unidad de símbolo” no solo es una elección lingüística, sino también una expresión de coherencia con la naturaleza del cálculo, y “符元” es una correspondencia natural en este marco.

De la misma forma que definir desde el nivel de símbolo es una alineación con la ontología del cálculo, nombrar desde el nivel semántico es más una interpretación que una definición.

六、La ruptura del lenguaje: cuando el mecanismo de traducción inversa falla en el mapeo

Opinión del artículo (interpretación combinada): “词元” ha ido formando una base de uso en la academia china, con cierta ventaja en difusión.

En un contexto multilingüe, hay que tener cuidado con el impacto sistémico de la “ruptura en la traducción inversa”. La evaluación de si un término científico-técnico tiene una vida útil a largo plazo no solo depende de su capacidad de expresar en chino, sino también de si puede lograr una correspondencia estable en el sistema académico internacional. Un término ideal debe tener “reversibilidad”, es decir, que pueda realizar una correspondencia semántica estable entre diferentes idiomas.

La evaluación anterior refleja la aceptabilidad de “词元” en el contexto local, pero desde una perspectiva multilingüe, aún hay espacio para discusión. Si un término solo funciona en un sistema lingüístico y no puede mantener una correspondencia estable en el contexto internacional, puede introducir costos adicionales en la comunicación académica.

En concreto, “词元” en el proceso de traducción inversa carece de una ruta clara y única. Cuando se traduce al inglés, a menudo se generan discrepancias entre conceptos cercanos: por ejemplo, “word unit” carece de una definición estricta, “morpheme” corresponde a la unidad mínima en lingüística, y “lexeme” se refiere a la forma canónica de una palabra. Estos conceptos no pueden cubrir exactamente el significado de Token en el contexto computacional, sino que introducen desplazamientos conceptuales.

En cambio, “符元” puede corresponderse más naturalmente con “symbolic unit (unidad simbólica)”. Este concepto tiene una base teórica clara y un uso estable en campos como la teoría de la información, matemáticas discretas y representación multimodal, y puede mantener una correspondencia semántica consistente en diferentes contextos. Por ello, en chino e inglés, es más fácil formar una relación uno a uno.

Desde la práctica, una vez que un término entra en artículos académicos, documentación técnica y escenarios de comunicación internacional, su capacidad de traducción inversa afectará directamente la eficiencia de la expresión y la precisión del entendimiento. Si un término requiere explicaciones adicionales para la conversión multilingüe, su costo de uso a largo plazo se acumulará.

Por tanto, en sistemas multilingües, el principal problema de “词元” radica en la inestabilidad de su ruta de mapeo, mientras que “符元” muestra mayor certeza en la correspondencia semántica y coherencia conceptual. En un mundo cada vez más globalizado en IA, elegir términos con buena capacidad de traducción inversa facilitará la construcción de sistemas académicos y tecnológicos abiertos y comunicables.

La reversibilidad internacional de un término es en esencia su indicador clave de longevidad académica.

七、El error de la uniformidad: que la forma sea igual no significa que la estructura sea igual

Opinión del artículo (opinión combinada de expertos): “词元” mantiene un estilo coherente con términos como “embeddings” y “attention”, siendo conciso y abstracto, adecuado para el contexto técnico en chino.

Conclusión previa: la unificación del sistema terminológico debe basarse en “isomorfismo conceptual”, no en “similitud formal en el lenguaje”.

En la argumentación a favor de “词元”, una razón común es que su estilo de expresión coincide con “embeddings” y “attention”, siendo simple y abstracto, y adecuado para el contexto técnico en chino. Esta razón refleja una necesidad real de coherencia en el sistema terminológico, pero el problema radica en que — si la unificación solo se mantiene en el nivel del lenguaje y no en el nivel estructural — se pasará de un “orden” a una “ilusión”.

“Embeddings” y “attention” son términos que corresponden a estructuras de cálculo claramente definidas: el primero es una transformación vectorial, el segundo un mecanismo de ponderación, y su denominación apunta directamente a la esencia del cálculo. En cambio, “词元” es un nombre interpretativo, cuya validez depende de la analogía con “palabra en sentido amplio”. Si se separa de la explicación, este nombre no tiene una dirección estructural coherente.

Este diferencial genera un problema clave: la coherencia formal no garantiza la coherencia semántica.

El primero reduce el costo de expresión, el segundo garantiza la estabilidad cognitiva. Si se prioriza solo la “coincidencia formal en el lenguaje”, la complejidad no desaparecerá, sino que se trasladará a una carga cognitiva a largo plazo; solo una denominación basada en “isomorfismo conceptual” puede mantener la estabilidad en diferentes contextos y en la evolución multimodal.

Cuando “embeddings”, “attention” y “词元” aparecen en paralelo, puede parecer que están en el mismo nivel conceptual, pero en realidad, los dos primeros son mecanismos, y el último es un objeto; los primeros tienen definiciones estrictas, mientras que el último depende del contexto y la explicación. Esta desalineación estructural puede generar fracturas implícitas en el sistema cognitivo.

Más importante aún, cuando la denominación de un concepto fundamental depende de analogías en lugar de definiciones estructurales, su impacto no se limita a un solo término, sino que se extiende a todo el sistema terminológico. Cuando los conceptos posteriores intentan desarrollarse en torno a esta denominación, deben explicar continuamente para mantener la coherencia, creando una dislocación estructural oculta.

En este sentido, “符元” ofrece una vía de expresión más cercana a la estructura subyacente. Se refiere directamente a los objetos básicos en los sistemas de cálculo — símbolos (symbol), sin depender de analogías explicativas, y puede mantenerse coherente en diferentes contextos.

El término no es solo una etiqueta, sino una entrada a la cognición. Un buen término permite que las explicaciones desaparezcan gradualmente, mientras que un término deficiente genera una proliferación de anotaciones. Cuando un concepto fundamental se desvía de la estructura, el sistema terminológico solo puede mantenerse mediante explicaciones, no mediante definiciones coherentes.

Conclusión

Desde una perspectiva ontológica, la elección terminológica no es solo un problema lingüístico, sino una temprana configuración de la estructura cognitiva en un campo. Si en las etapas iniciales la denominación se desvía de su ontología estructural, el sistema posterior solo podrá mantenerse mediante explicaciones continuas, sin poder formar una red conceptual coherente.

En la trayectoria hacia la inteligencia artificial general y la integración multimodal, un término que pueda alinearse con la ontología computacional y mantener la estabilidad en diferentes contextos será más probable que sea una base cognitiva duradera. En este sentido, una ruta de denominación centrada en “unidad de símbolo” ofrece un equilibrio más adecuado entre la naturaleza técnica y la claridad cognitiva.

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.