O Coinbase CEO, Brian Armstrong, publicou que, ao otimizar a infraestrutura, a empresa reduziu os gastos empresariais com IA em quase metade, enquanto o uso de tokens de IA continua a crescer exponencialmente. As medidas principais de redução de custos incluem: definir modelos de código aberto como GLM 5.2 e Kimi 2.7 como opções padrão para o gateway interno de LLM, utilizando encaminhamento inteligente para combinar tarefas com os modelos mais rentáveis, e aumentar significativamente a taxa de acertos de cache de ferramentas como o LibreChat de 5% para 60%. Armstrong enfatizou que o objetivo de gerir os custos de IA não é limitar o uso, mas sim tornar o crescimento exponencial sustentável através da redução do desperdício.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário