工业革命时代,煤炭越便宜,大家烧得越多。现在 AI 时代的 Token 也是这样


Token 便宜了,AI 产品反而更能烧了
以前你问一句,模型答一句,就结束了
现在你点一下,Agent 在后台拆任务、查资料、调工具、写代码、改错、总结,跑一整套流程
所以单个 Token 是便宜了,但一次任务吃掉的 Token 多了太多
这就是账单还在涨的原因
蒸汽机更省煤以后,英国没有少烧煤。因为煤变得更划算,更多机器、工厂、铁路都开始烧煤
Token 也是这个逻辑
便宜以后,Agent、Deep Research、AI 编程、长上下文、企业自动化才真的跑起来
所以 AI 的成本中心正在从训练转到推理
训练是烧一阵子,推理是一直烧。用户在线,它就在烧。Agent 在跑,它就在烧。上下文越长,缓存越大,内存、带宽、电力、散热全都跟着吃紧
这也是为什么 AI 产业链不能只看 GPU
HBM、DRAM、SSD、先进封装、光模块、交换芯片、CPU、推理芯片,都会被这波推理需求重新定价
AI 应用公司也会被迫分层
只包一层界面、全靠闭源 API 的公司,用户越多,账单越大,毛利越薄
真正的壁垒会往下沉:路由、量化、缓存、批处理、上下文裁剪、小模型替代大模型
嗯,Token 就是煤
post-image
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论