NVIDIA open-source 120B modelo de agente Nemotron 3 Super: ativando apenas uma décima parte dos parâmetros, com throughput até 5 vezes superior ao anterior

robot
Geração de resumo em curso

Notícias do CoinWorld, de acordo com monitoramento do 1M AI News, a Nvidia lançou o modelo de linguagem de código aberto Nemotron 3 Super, projetado para aplicações de múltiplos agentes inteligentes. O modelo possui um total de 120 bilhões de parâmetros, utiliza uma arquitetura híbrida Mamba-Transformer MoE, ativando apenas 12 bilhões de parâmetros por token durante a inferência. Sua tecnologia central, “Latent MoE” (MoE Latente), comprime o embedding do token em um espaço latente de baixa classificação antes de roteá-lo para a rede de especialistas, permitindo ativar 4 especialistas ao mesmo tempo com o custo computacional de um único especialista, aumentando a taxa de processamento de inferência em até 5 vezes em relação à geração anterior, Nemotron Super. O modelo suporta nativamente uma janela de contexto de 1 milhão de tokens, ideal para agentes autônomos que precisam manter o estado do fluxo de trabalho por longos períodos. Na avaliação de carga de trabalho de agentes inteligentes com o benchmark PinchBench, o Nemotron 3 Super obteve uma pontuação de 85,6%, a mais alta entre modelos de código aberto similares. A Nvidia também disponibilizou um conjunto de dados de treinamento com mais de 100 trilhões de tokens, 15 ambientes de aprendizado por reforço e planos de avaliação, sob a licença NVIDIA Nemotron Open Model License. O modelo já está disponível nas plataformas Hugging Face, build.nvidia.com, Perplexity, OpenRouter, entre outras, e pode ser implantado via Google Cloud, Oracle, AWS Bedrock, Azure e outros provedores de nuvem. Empresas como Perplexity, CodeRabbit, Cadence, Dassault Systèmes e Siemens já adotaram o modelo.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
0/400
Nenhum comentário
  • Fixar