Em teoria, os custos da IA já deviam ter colapsado até agora.


A mesma tarefa de nível avançado que custava 30 dólares por milhão de tokens no lançamento do GPT-4 em 2023 custa hoje 1,25 dólares com o GPT-5. Uma redução de 96 vezes em três anos, entre modelos nomeados com preços publicados.
Por qualquer regra normal, as faturas de IA das empresas deviam estar a cair a pique. Em vez disso, os orçamentos médios de IA das Fortune-500 passaram de $7M em 2024 para $19M em 2026. Quase 3 vezes em dois ciclos orçamentais.
A razão: tokens baratos não são poupados, são armados. Um chatbot dispara tokens uma vez e para. Um agente que faz trabalho real executa 5 a 30 vezes mais para a mesma tarefa, e quando a inferência é tão barata, apontas-na para tudo. Cada corte de preço desbloqueia mais utilização do que poupa.
O centro de custos não encolheu. Mudou da camada do modelo para a infraestrutura subjacente. É aí que a fatura real está a ser escrita, e a maioria das empresas ainda não a abriu.
Ver original
post-image
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado