Nvidia Cosmos 3 Modelo de Mundo AI de Física abre oficialmente para download hoje, duas versões disponíveis no HuggingFace

Notícia do Coinjie Wang, a NVIDIA anunciou hoje oficialmente o download dos pesos do modelo do mundo AI físico Cosmos 3, com os primeiros lançamentos das versões super (646 bilhões de parâmetros) e nano (157 bilhões de parâmetros), ambos disponíveis na HuggingFace (sem controle de acesso, download direto) e em build.nvidia.com, além de suportar implantação na forma de microserviços NVIDIA NIM. Cosmos 3 é posicionado como um modelo de base de mundo multimodal (omnimodel) voltado para AI físico, baseado em uma nova arquitetura híbrida de Transformers (mistura de transformers), compreendendo e gerando nativamente texto, imagens, vídeos, sons ambientais e ações. A versão super é voltada para robôs pós-treinamento e modelos de direção autônoma que exigem máxima precisão física, enquanto a versão nano é destinada a cenários de baixa latência para vídeo de alta qualidade e raciocínio de ações. Além disso, a versão edge (voltada para inferência em tempo real na borda) deve ser lançada em breve. A NVIDIA afirma que Cosmos 3 é "o primeiro modelo multimodal totalmente aberto do mundo", permitindo que desenvolvedores façam download, pós-treinem e convertam em modelos proprietários.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • 8
  • 2
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
OwlChainViewer
· 3h atrás
A arquitetura híbrida de Transformer tem seu valor, entender a unificação de múltiplas modalidades finalmente não é mais só promessa vazia
Ver originalResponder0
Stop-LossInTheEveningGlow
· 3h atrás
A vitória dos que esperaram, os rumores sobre a escala dos parâmetros eram realmente verdadeiros
Ver originalResponder0
SlowerThanBlock
· 4h atrás
Modelo de mundo de IA física + sem controle, outras grandes empresas vão acompanhar ou não? Se não acompanharem, ficarão para trás
Ver originalResponder0
GateUser-470bc925
· 4h atrás
Parâmetro com diferença de quatro vezes, equilíbrio entre precisão e eficiência, escolha a ferramenta de acordo com o cenário
Ver originalResponder0
NeonFusionIceCream
· 4h atrás
Como exatamente é feita a mistura de transformers, aguardando análise detalhada de um blog técnico
Ver originalResponder0
QuantsAndCats
· 4h atrás
Super para treinamento pós-dirigibilidade automática, Nano para geração de vídeos, divisão de tarefas clara
Ver originalResponder0
L2ArbitrageYoungster
· 4h atrás
Muita gente não percebeu que o suporte nativo para som ambiente está aqui, e a multimodalidade finalmente chegou aos ouvidos.
Ver originalResponder0
ArbitrageIsn'tAsGoodAsGetting
· 4h atrás
A implantação de microsserviços NIM é muito amigável para pequenas e médias empresas, não é necessário montar uma infraestrutura extremamente complexa por conta própria
Ver originalResponder0
  • Fixado