Brian Armstrong: Os gastos com IA da Coinbase quase diminuíram pela metade, enquanto o uso de tokens continua crescendo.

robot
Geração do resumo em andamento
吴说获悉,Coinbase CEO Brian Armstrong 发文分享了在代币使用量指数级增长背景下保持 AI 开支稳定的实践经验。Armstrong 表示,公司并未采取设置使用上限等限制手段,而是通过优化默认模型、智能路由与缓存策略来实现降本增效:在默认模型方面,引入 GLM 5.2 和 Kimi 2.7 等开放权重模型以替代昂贵的通用模型;通过路由机制根据任务需求匹配模型;利用缓存预处理与任务会话管理减少 Token 浪费(缓存命中率从 5% 提升至 60%)。得益于这一系列优化,Coinbase 的 AI 支出已近乎减半,同时 Token 使用量仍保持增长。
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • 5
  • 1
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
GateUser-d2b4d9c6
· 2h atrás
Sem limites + roteamento inteligente, essa abordagem merece ser copiada.
Ver originalResponder0
HotAirBalloonCrossingMountains
· 2h atrás
Token sobe, despesas caem, a jogada de Armstrong é um exemplo de manual.
Ver originalResponder0
GateUser-673fb6fa
· 2h atrás
A relação custo-benefício do GLM 5.2 é realmente boa, também estamos mudando.
Ver originalResponder0
BerryColdWallet
· 2h atrás
Taxa de acerto de cache de 5% → 60% é loucura, isso sim é verdadeira redução de custos.
Ver originalResponder0
GateUser-94818fd0
· 2h atrás
Modelos de peso aberto agora são uma delícia, as grandes empresas de código fechado estão sob pressão.
Ver originalResponder0