o principal engenheiro da openAI queima bilhões de tokens por dia.


não está experimentando. está trabalhando.
codex rodando todas as noites. inferência ilimitada na databricks.
é assim que fica a nova linha de base.
a maioria das pessoas ainda está racionando tokens como se fosse 2023.
os que não estão estão deixando todo mundo para trás.
estamos contratando engenheiros de inferência que querem construir a infraestrutura por trás de trilhões de tokens.
se você já trabalhou com SGlang, vLLM ou pytorch em escala.. me envie uma mensagem privada.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado