Meituan abre teste para modelo massivo de trilhões de parâmetros, treinamento concluído inteiramente por cluster de computação doméstico.

robot
Geração de resumo em curso

AIMPACT notícias, 24 de abril (UTC+8), segundo informações do setor, o novo modelo base de grande escala da Meituan, LongCat-2.0-Preview, já está em testes abertos. O modelo ultrapassou o trilhão de parâmetros totais, entrando na categoria dos principais modelos de grande escala a nível global.

Segundo fonte informada, o novo modelo V4 de grande escala lançado pela DeepSeek no mesmo dia tem o número total de parâmetros e o número de parâmetros ativados praticamente idênticos ao LongCat-2.0-Preview da Meituan.

Além da escala de parâmetros, o maior avanço do novo modelo base de grande escala da Meituan reside no facto de todo o processo de treino e inferência ter sido concluído com recurso a clusters de computação nacionais.

De acordo com a mesma fonte, o número de placas de computação utilizadas pela Meituan na fase de treino situou-se entre 50.000 e 60.000, o que constitui a maior tarefa de treino de modelo de grande escala alguma vez concluída em computação nacional. (Interface) (Fonte: BlockBeats)

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado