token reduzido em 60%, só pode indicar que a inferência ficou mais barata.


Mas o desenvolvedor que compra o agente não está comprando acesso ao modelo bruto, e sim comprando uma diferença que no final pode ou não entrar no repositório.
Quantos tokens foram consumidos no meio, quantas trocas de mensagens foram feitas, essencialmente, são custos de execução do próprio fornecedor.
2/6
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado