Brian Armstrong: Os gastos com IA da Coinbase caíram quase pela metade, enquanto o uso de Token continua a crescer.

robot
Geração de resumo em curso
吴说获悉,Coinbase CEO Brian Armstrong 发表文章,分享了在代币使用量指数级增长的背景下,保持 AI 开支稳定的实践经验。Armstrong 表示,公司并未采取设置使用上限等限制手段,而是通过优化默认模型、智能路由与缓存策略来实现降本增效:在默认模型方面,引入 GLM 5.2 和 Kimi 2.7 等开放权重模型以替代昂贵的通用模型;通过路由机制根据任务需求匹配模型;利用缓存预处理与任务会话管理减少 Token 浪费(缓存命中率从 5% 提升至 60%)。得益于这一系列优化,Coinbase 的 AI 支出已近乎减半,同时 Token 使用量仍保持增长。
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • 5
  • 1
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
GateUser-d2b4d9c6
· 2h atrás
Sem limites + roteamento inteligente, esta ideia vale a pena copiar.
Ver originalResponder0
HotAirBalloonCrossingMountains
· 2h atrás
Token sobe, despesa cai, este movimento de Armstrong é de manual.
Ver originalResponder0
GateUser-673fb6fa
· 2h atrás
A relação qualidade/preço do GLM 5.2 é realmente muito competitiva, também estamos a mudar.
Ver originalResponder0
BerryColdWallet
· 2h atrás
A taxa de acerto de cache de 5%→60% é inacreditável, é assim que se reduz verdadeiramente os custos.
Ver originalResponder0
GateUser-94818fd0
· 2h atrás
Os modelos de pesos abertos são agora muito bons, as grandes empresas de código fechado estão sob pressão.
Ver originalResponder0