Aran 将《苦涩的教训》译成9种语言，测试各模型分词工具，以英文原文 token 数为基准。结果显示同一中文在不同模型上 token 差异显著：Claude 1.65 倍、OpenAI 1.15 倍、Kimi 0.81 倍、Qwen 0.85 倍；Hindi 在 Claude 超过 3 倍，Anthropic 最低。结论：token 越多越贵，分词工具对语言优化程度决定效率，市场份额大的语言更省 token。

区块律动

2026-04-29 08:22:06

摘要生成中

据动察 Beating 监测，AI 研究者 Aran Komatsuzaki 把 Rich Sutton 的知名论文「苦涩的教训」（The Bitter Lesson）翻成 9 种语言，喂进 OpenAI、Gemini、Qwen、DeepSeek、Kimi、Claude 6 家模型的分词工具（tokenizer），以英文原文在 OpenAI 分词工具上的 token 数为 1 倍基准，看各语言在各模型上花多少倍。结果：同样的内容用中文问 Claude，token 消耗是基准的 1.65 倍；用 OpenAI 只有 1.15 倍。印地语在 Claude 上更夸张，超过基准 3 倍。6 家横评里 Anthropic 垫底。

翻译会改变文本长度，所以跟英文比的倍数不完全精确。但更有说服力的是同一段中文在不同模型上的表现（仍以同一基准）：Kimi 只花 0.81 倍（比英文还少），Qwen 0.85 倍，到 Claude 上变成 1.65 倍。文本完全一样，差距纯粹是分词工具的效率问题。中国模型处理中文比英文还省，说明问题不在中文本身，而在分词工具有没有为该语言做过优化。

对用户来说，token 多了，API 直接变贵，模型回答前等待更久，上下文窗口也更快用完。分词工具的效率取决于训练数据中各语言的占比：英文数据多，英文词被高效压缩；非英文数据少，只能切得很碎。Aran 的结论：谁的市场大，谁就更省 token。

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

赞赏
点赞
评论
转发
分享

请输入评论内容

暂无评论

热门话题
查看更多
#
WCTC交易王PK
38.04万热度
#
美联储利率不变但内部分歧加剧
9339 热度
#
Polymarket每日热点
70.95万热度
#
比特币现货交易量新低
16265.66万热度
#
油价突破110美元
86.65万热度

Claude的中文税：问同样内容比英文多花65%token，OpenAI只多15%

热门话题

WCTC交易王PK

美联储利率不变但内部分歧加剧

Polymarket每日热点

比特币现货交易量新低

油价突破110美元

置顶