Armstrong 这波降本增效的操作确实硬核,缓存命中率从 5% 拉到 60%,AI 支出直接砍半,Token 还在涨,值得研究。

TOKEN-1.27%
吴说区块链
Brian Armstrong:Coinbase 的 AI 支出已近乎减半,同时 Token 使用量仍保持增长
Armstrong 分享在代币使用量激增背景下降本增效的做法:不设限,通过优化默认模型、智能路由与缓存策略控费。采用 GLM 5.2、Kimi 2.7 等开放权重模型替代昂贵通用模型,按任务路由匹配,缓存预处理与会话管理降低 Token 浪费,命中率由 5% 提升至60%。结果 AI 支出几乎减半,Token 使用量仍在增长。
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论