Mensagem da Deep Current TechFlow, 30 de junho, de acordo com o The Information, uma fonte familiarizada com o assunto revelou que, no início deste mês, engenheiros da OpenAI disseram a alguns colegas que, com base em várias tecnologias de otimização recentemente desenvolvidas, encontraram uma solução para reduzir os custos de inferência do modelo em mais de metade. Após aplicar esta nova tecnologia ao cenário em que visitantes sem contas gratuitas ou pagas utilizam o ChatGPT, eles reduziram o número necessário de unidades de processamento gráfico (GPU) da NVIDIA para apenas algumas centenas.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado