Tinygrad afirma que o GLM5.2 pode atingir 120 tok/s em uma configuração Blackwell de ligação dupla, com um preço de 150.000 dólares.

robot
Geração de resumo em curso

BlockBeats notícia, 21 de junho, o vendedor de GPU Tinygrad publicou que, de acordo com fontes confiáveis, o modelo GLM 5.2 pode alcançar uma velocidade de inferência de 120 tokens por segundo em duas Tinybox conectadas à rede com arquitetura Blackwell.

Essa configuração custa 150.000 dólares, podendo optar por duas Tinybox padrão ou uma Tinybox Pro, ambas capazes de atingir o desempenho mencionado. Tinygrad usa isso como diferencial, promovendo uma rota de implantação privada de "compra única, sem pagar taxas de nuvem", competindo diretamente com serviços de inferência na nuvem baseados em cobrança por uso.

Atualmente, essa notícia ainda não foi confirmada oficialmente pela GLM, e a Tinygrad também não revelou mais detalhes técnicos.


Clique no link original abaixo para se juntar ao canal de notícias de IA Beating · Feishu, monitorando 24/7 os principais destaques e notícias globais de IA.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado