Parabéns à equipe de pesquisa por avançar a inferência do DeepSeek V3/R1.



Na NVIDIA GB200 NVL72, estão a alcançar 26k tokens de entrada/s e 13k tokens de saída/s por GPU — uma aceleração de quase 4× / 5× em comparação com H100.

Eles conseguiram isso com NVFP4 MoE, atenção FP8, paralelismo de especialistas em redução de escala.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • 7
  • Repostar
  • Compartilhar
Comentário
0/400
MEVSupportGroupvip
· 8h atrás
4 vezes mais poderoso, não é?
Ver originalResponder0
shadowy_supercodervip
· 9h atrás
Isto está muito competitivo, não está?
Ver originalResponder0
DefiOldTrickstervip
· 9h atrás
O velho já está acostumado a grandes tempestades, a GPU também pode até à lua em um segundo.
Ver originalResponder0
DaoTherapyvip
· 9h atrás
Mais uma tremenda inovação tecnológica
Ver originalResponder0
MerkleDreamervip
· 9h atrás
O sabor está bom, a velocidade está nas nuvens.
Ver originalResponder0
PanicSellervip
· 9h atrás
Ainda não é suficiente para correr 3090
Ver originalResponder0
0xLuckboxvip
· 9h atrás
bull ah AI corre tão rápido
Ver originalResponder0
  • Marcar
Negocie criptomoedas a qualquer hora e em qualquer lugar
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)