العقود الآجلة
وصول إلى مئات العقود الدائمة
TradFi
الذهب
منصّة واحدة للأصول التقليدية العالمية
الخیارات المتاحة
Hot
تداول خيارات الفانيلا على الطريقة الأوروبية
الحساب الموحد
زيادة كفاءة رأس المال إلى أقصى حد
التداول التجريبي
مقدمة حول تداول العقود الآجلة
استعد لتداول العقود الآجلة
أحداث مستقبلية
"انضم إلى الفعاليات لكسب المكافآت "
التداول التجريبي
استخدم الأموال الافتراضية لتجربة التداول بدون مخاطر
إطلاق
CandyDrop
اجمع الحلوى لتحصل على توزيعات مجانية.
منصة الإطلاق
-التخزين السريع، واربح رموزًا مميزة جديدة محتملة!
HODLer Airdrop
احتفظ بـ GT واحصل على توزيعات مجانية ضخمة مجانًا
منصة الإطلاق
كن من الأوائل في الانضمام إلى مشروع التوكن الكبير القادم
نقاط Alpha
تداول الأصول على السلسلة واكسب التوزيعات المجانية
نقاط العقود الآجلة
اكسب نقاط العقود الآجلة وطالب بمكافآت التوزيع المجاني
“اقتصاديات التوكن”: الذكاء الاصطناعي بحاجة لإعادة حساب الأمور
المصدر: صحيفة بكين التجارية
“Token”正在成为AI行业最热的词。近日召开的2026中关村论坛年会上، Kimi创始人兼CEO杨植麟、智谱CEO张鹏的话题绕不开它。杨植麟将Token定义为未来的GDP,张鹏直言“Token长期靠低价竞争不利于行业发展”。1000多公里外,腾讯高级执行副总裁汤道生和副总裁李强也分别谈及Token,前者称“同样模型能力下,不同的Harness(脚手架)设计,Token成本相差很大”,后者认为Token切换很容易,黏性弱、补贴一停客户很容易流失。当OpenClaw(网友昵称“龙虾”)们让Token消耗呈指数级爆发,Token不再只是技术名词,而是关乎商业模式的关键变量。
Token“烧穿”成本
龙虾掀起的智能体热潮,让Token消耗量呈指数级爆发。Token是什么?国家数据局的定义是AI大模型处理信息的最小单元,Token可计量、可定价、可交易。
百度千帆平台产品负责人张婷向北京商报记者解释,“它既不完全等于一个字,也不完全等于一个词,而是介于两者之间的一种‘语言碎片’。比如汉字‘我’是一个Token,‘今天’可能是一个Token,但‘国际化’可能被拆成‘国际’和‘化’两个Token。因为大模型面对的语言是全球性的,Token是一种通用的‘最大公约数’,让模型可以用统一的方式处理所有语言和符号”。
根据国家数据局消息,2024年初,中国日均Token调用量为1000亿;至2025年底,跃升至100万亿;2026年3月,已突破140万亿,两年增长超千倍。
云厂商与AI大模型企业的反应从2月开始,智谱取消对GLM Coding Plan的首购优惠,套餐价格整体涨幅30%起。3月上旬,腾讯云已上调两款自研模型价格,其中Tencent HY2.0 Instruct模型涨幅达463%,下旬阿里云、百度智能云同日宣布AI算力涨价,最高涨幅34%。
对于智能体火爆到Token消耗增长的逻辑链路,张鹏近日做了详细解释:Agent在面临复杂任务时,模型思考的链路很长,Token消耗量非常大,模型推理的成本也相应地提高,因此把Token的价格回归到正常的商业价值。长期靠低价竞争也不利于整个行业的发展。
在接受北京商报记者等媒体采访时,李强表示,“Token的经济性很快也会被所有的客户关注到,如果只考虑消耗量不考虑经济性,可能你在用户端的价格或成本会更高,这将对公司的长远健康发展带来负面影响”。
Harness“脚手架”藏在水面下
Token到底是怎样定价的?张婷向北京商报记者举例拆解,“比如‘今天北京天气怎么样’,加上AI的回答,大概消耗50—100个Token。你让AI写一篇800字的作文,算上你的提示词和完整输出,大概消耗1000—1500个Token”。“换算成钱:目前百度千帆平台上主流模型的价格,每百万Token几毛钱的水平。也就是说,1块钱可以让AI写大约1000篇800字作文。”张婷表示。
但当Token消耗量以指数级增长,一个更深层的问题浮出水面:这些Token并非都花在了“刀刃”上。“Token像汽油,Agent像汽车引擎。如果只关注油耗,不关注引擎的经济性和输出能力,客户最终也会舍弃。”李强用油耗来解读Token的效率。
Nextie(明日新程)创始人、“小冰之父”李笛也向北京商报记者表示,“Token消耗热指向了一个有趣的现象:Tokenmaxxing(即Token刷量大赛),现在很多开发者和公司在疯狂刷高Token消耗量,甚至将其视为一种‘算力肌肉’的展示。但这种无节制的燃烧会带来巨大的ROI(投资回报率)失衡”。
在以上背景下,另一个概念Harness在硅谷和国内技术圈快速出圈。
李笛向北京商报记者详细解释,Harness的直译是“马具”或“缰绳”。如果说大模型是一匹力大无穷但方向不定的野马,Harness就是那套能让它在既定轨道上奔跑的约束系统。
“AI落地不只是算法题,更是工程题,”汤道生抛出这个判断,“在同样的模型能力下,不同的脚手架或Harness的设计,比如给模型调用什么工具、有层次的上下文工程、长记忆的管理、工作流的实现等,都对实际使用效果与Token成本有很大的影响。”
小米MiMo大模型负责人罗福莉在解读OpenClaw价值时也提到这个名词,“OpenClaw把国内那些‘次闭源’水平模型的上限拉得很高,同时可以靠一套Harness(约束控制体系)等诸多设计,保证模型的任务完成度和准确率,把下限保证得很好”。
云厂商重造“地基”
具体到工程层面,腾讯云智能体开发平台ADP,通过RAG(检索增强生成)、知识库等能力给智能体连接上“图书馆”,让行业专家永远在线。然后是Claw跑在Agent Runtime的安全沙箱:Claw作为智能系统的神经中枢,通过从技能库发现与下载Skills,不断学习与积累连接外部系统的能力,借助大模型来对外收发指令,触发行动;AgentRuntime的沙箱方案还能用于大模型强化学习的程序结果验证,提升强化学习的训练效率。
这只是基础设施的冰山一角。
“算力的尽头可能就是电力。”李强在采访中透露,腾讯两年前开始探索算电协同,“与合作伙伴在内蒙古利用当地的风电和光储直接为数据中心供电,结合氢能和储能平衡清洁能源的波峰波谷,同时协调算力的高峰期与低谷期,一方面大幅度降低用电成本,另一方面降低碳排放。”
另一层的变化发生在调度机制。“当前云计算时代的基础设施是为服务人类工程师设计的,而不是为AI设计的。长远来看,基础设施应该是一个整体,这一整套应该能够自我进化、自我迭代,能够形成一个自主的组织,相当于整套基础设施由一个被认可的CEO来管理,它可能是一个Claw,根据它的AI客户需求,自主迭代自己的基础设施”,无问芯穹联合创始人兼CEO夏立雪解释道。
值得注意的是,目前头部云厂商拥有双重身份,阿里云、腾讯云、百度智能云都既是Token供给方,也是Token消耗方。
根据阿里云最近公布的目标,未来五年,云和AI商业化年收入将突破1000亿美元。同时,阿里集团向员工提供Token额度,鼓励员工在工作中使用先进的AI模型与工具。
李强称,“Token肯定是腾讯云非常重要的管理指标之一,但没有把Token放在最高优先级,且用极端奖励政策来推动,腾讯更愿意把精力放在研发更好的引擎上,通过提供好用的AI产品产生真实的Token消耗”。2025年腾讯云实现规模化盈利,“2026年我们不想太激进”,李强直言。
当140万亿Token冲击产业,又一轮较量已经开始。
北京商报记者 魏蔚
海量资讯、精准解读,尽在新浪财经APP
责任编辑:高佳