吴说获悉,Coinbase CEO Brian Armstrong 发文表示,公司通过优化基础设施,已将企业 AI 支出削减了近一半,同时 AI 代币使用量仍在指数级增长。其核心降本措施包括:将 GLM 5.2 和 Kimi 2.7 等开源模型作为内部 LLM 网关的默认选项,通过智能路由为任务匹配最具性价比的模型将 LibreChat 等工具的缓存命中率从 5% 大幅提升至 60% 。Armstrong 强调,管理 AI 成本的目标不是限制使用,而是通过减少浪费让指数级增长变得可持续。



Tradução: O Wu Shuo soube que o CEO da Coinbase, Brian Armstrong, publicou uma mensagem afirmando que a empresa, ao otimizar a infraestrutura, já reduziu os gastos corporativos com IA em quase metade, enquanto o uso de tokens de IA continua crescendo exponencialmente. Suas principais medidas de redução de custos incluem: adotar modelos de código aberto como GLM 5.2 e Kimi 2.7 como opções padrão para o gateway LLM interno, usando roteamento inteligente para combinar tarefas com o modelo mais custo-efetivo, aumentando drasticamente a taxa de acerto de cache de ferramentas como LibreChat de 5% para 60%. Armstrong enfatizou que o objetivo de gerenciar os custos de IA não é limitar o uso, mas tornar o crescimento exponencial sustentável ao reduzir o desperdício.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários