le principal ingénieur chez openAI consomme des milliards de jetons par jour.


pas en expérimentant. en travaillant.
codex fonctionne toutes les nuits. inférence illimitée chez databricks.
voici à quoi ressemble la nouvelle référence.
la plupart des gens rationnent encore leurs jetons comme en 2023.
ceux qui ne le font pas dépassent tout le monde.
nous recrutons des ingénieurs en inférence qui veulent construire l'infrastructure derrière des trillions de jetons.
si vous avez touché à SGlang, vLLM, ou pytorch à grande échelle.. Envoyez-moi un message privé.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé