Nvidia Cosmos 3 Modèle physique AI du monde aujourd'hui officiellement disponible en téléchargement, deux versions lancées sur HuggingFace

Nouvelles de Coinjie.com, Nvidia a officiellement lancé aujourd'hui le téléchargement des poids du modèle mondial Cosmos 3 pour l'IA physique, avec la première version publiée comprenant super (646 milliards de paramètres) et nano (157 milliards de paramètres), toutes deux disponibles sur HuggingFace (sans contrôle d'accès, téléchargement direct) et build.nvidia.com, tout en supportant le déploiement sous forme de microservices NVIDIA NIM. Cosmos 3 est conçu comme un modèle de base mondial omnimodal (omnimodel) pour l'IA physique, basé sur une toute nouvelle architecture hybride de transformateurs (mixture of transformers), comprenant la compréhension et la génération natives de texte, d'images, de vidéos, de sons ambiants et d'actions. La version super vise les modèles post-entraînement pour robots et véhicules autonomes nécessitant la plus haute précision physique, tandis que la version nano cible les scénarios à faible latence pour la vidéo de haute qualité et le raisonnement sur les actions. De plus, une version edge (destinée au raisonnement en temps réel en périphérie) devrait être publiée prochainement. Nvidia affirme que Cosmos 3 est « le premier modèle omnimodal entièrement ouvert au monde », permettant aux développeurs de le télécharger librement, de le post-entraînement et de le convertir en modèle propriétaire.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 8
  • 2
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
OwlChainViewer
· Il y a 3h
L'architecture Transformer hybride a du potentiel, une compréhension unifiée de toutes les modalités n'est enfin plus un rêve pieux.
Voir l'originalRépondre0
Stop-LossInTheEveningGlow
· Il y a 3h
La victoire des patienceux, la taille du paramètre évoquée dans les rumeurs s'avère être vraie
Voir l'originalRépondre0
SlowerThanBlock
· Il y a 4h
Modèle de monde physique AI + sans contrôle, les autres grands acteurs suivront-ils ? Ne pas suivre, c'est prendre du retard.
Voir l'originalRépondre0
GateUser-470bc925
· Il y a 4h
Les paramètres diffèrent d’un facteur quatre, le compromis entre précision et efficacité, choisissez la lame en fonction du scénario
Voir l'originalRépondre0
NeonFusionIceCream
· Il y a 4h
Comment le mélange de transformers est-il réalisé précisément, décryptage par un blog technique
Voir l'originalRépondre0
QuantsAndCats
· Il y a 4h
Entraînement post-conduite autonome avec Super, génération vidéo avec Nano, répartition claire des tâches
Voir l'originalRépondre0
L2ArbitrageYoungster
· Il y a 4h
Beaucoup de gens n'ont pas remarqué que l'environnement sonore natif est pris en charge, la multimodalité a enfin mis les oreilles à l'œuvre.
Voir l'originalRépondre0
ArbitrageIsn'tAsGoodAsGetting
· Il y a 4h
Le déploiement de microservices NIM est très convivial pour les petites et moyennes entreprises, elles n'ont pas besoin de mettre en place une infrastructure extrêmement complexe.
Voir l'originalRépondre0
  • Épinglé