Cette vague de cache implicite d'Alibaba réduit directement 80 % des coûts, le cauchemar de la consommation excessive d'argent des agents à long contexte trouve enfin une solution.

Voir l'original
CoinNetwork
CoinWorld消息,阿里qwen团队宣布在阿里云百炼平台为旗下旗舰模型qwen3.7-max默认开启自动隐式缓存。
开发者无需修改代码或额外指定参数,即可直接享用缓存降本。
在全新的计费机制下,系统会自动识别并提取请求中的重复上下文前缀。
一旦发生缓存命中,命中部分的输入token费用仅按原单价的20%收取,直接免去八成输入成本。
隐式缓存直接针对长文本与agent智能体场景下的巨额开销。
拥有100万tokens长上下文窗口的qwen3.7-max在运行自主编码等高阶任务时,需要高频、重复读取庞大的代码库或知识文档。
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé