Com algumas centenas de placas é possível suportar o tráfego de visitantes. Se esta tecnologia de otimização fosse de código aberto, quanto é que as pequenas e médias empresas poderiam poupar no orçamento de capacidade de computação?

Ver original
CoinNetwork
Notícias do Coin World, a OpenAI encontrou recentemente um conjunto de soluções de otimização capazes de reduzir os custos de inferência dos modelos em mais de metade. De acordo com uma fonte informada, engenheiros da OpenAI disseram a alguns colegas no início deste mês que, com base em várias novas tecnologias de otimização desenvolvidas, conseguiram reduzir o número necessário de GPUs da NVIDIA para apenas algumas centenas, especialmente após aplicar esta tecnologia no cenário de visitantes que usam o ChatGPT sem contas gratuitas ou pagas.
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado