Na era da Revolução Industrial, quanto mais barato o carvão, mais as pessoas queimavam. Agora, na era da IA, o Token é assim mesmo


Quando o Token fica barato, os produtos de IA podem queimar ainda mais
Antes, você perguntava uma coisa, o modelo respondia, e acabava ali
Agora, você clica, o Agente desmembra tarefas, pesquisa informações, ajusta ferramentas, escreve código, corrige erros, faz resumos, executa um fluxo completo
Por isso, o Token individual ficou barato, mas uma única tarefa consome muitos Tokens
Essa é a razão de as contas ainda estarem crescendo
Depois que a máquina a vapor ficou mais eficiente, o Reino Unido não deixou de queimar carvão. Porque o carvão ficou mais vantajoso, mais máquinas, fábricas e ferrovias começaram a queimar carvão
O Token segue essa lógica também
Depois de ficar barato, Agentes, Pesquisa Profunda, Programação de IA, contexto longo, automação empresarial realmente começaram a decolar
Por isso, o centro de custos da IA está mudando de treinamento para inferência
Treinar consome por um tempo, inferir consome o tempo todo. Quando o usuário está online, está consumindo. Quando o Agente está rodando, está consumindo. Quanto maior o contexto, maior o cache, a memória, a largura de banda, a energia, o resfriamento, tudo fica mais apertado
Por isso, a cadeia de valor da IA não pode se limitar apenas a GPUs
HBM, DRAM, SSD, empacotamento avançado, módulos ópticos, chips de troca, CPU, chips de inferência, todos serão reprecificados por essa demanda de inferência
As empresas de aplicações de IA também serão forçadas a se dividir em camadas
Aquelas que só oferecem uma interface, dependentes de APIs fechadas, quanto mais usuários, maior a conta, menor a margem de lucro
As verdadeiras barreiras vão se aprofundar: roteadores, quantificação, cache, processamento em lote, corte de contexto, substituição de grandes modelos por pequenos modelos
Hmm, Token é como carvão
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar