阿里这波隐式缓存直接砍掉八成成本,长上下文Agent的烧钱噩梦终于有解了

币 界 网
币界网消息,阿里qwen团队宣布在阿里云百炼平台为旗下旗舰模型qwen3.7-max默认开启自动隐式缓存。开发者无需修改代码或额外指定参数,即可直接享用缓存降本。在全新的计费机制下,系统会自动识别并提取请求中的重复上下文前缀。一旦发生缓存命中,命中部分的输入token费用仅按原单价的20%收取,直接免去八成输入成本。隐式缓存直接针对长文本与agent智能体场景下的巨额开销。拥有100万tokens长上下文窗口的qwen3.7-max在运行自主编码等高阶任务时,需要高频、重复读取庞大的代码库或知识文档。
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论