Nvidia Cosmos 3 Modelo de Mundo AI Física abre oficialmente la descarga hoy, dos versiones disponibles en HuggingFace

La noticia de CoinWorld, NVIDIA ha abierto oficialmente hoy la descarga de los pesos del modelo mundial de IA física Cosmos 3, lanzando las primeras versiones super (646 mil millones de parámetros) y nano (157 mil millones de parámetros), ambas disponibles en HuggingFace (sin restricciones, se pueden descargar directamente) y build.nvidia.com, además de soportar su despliegue en forma de microservicio NIM de NVIDIA. Cosmos 3 está diseñado como un modelo base mundial de modalidad múltiple (omnimodel) para IA física, basado en una nueva arquitectura híbrida de transformadores (mezcla de transformadores), que comprende comprensión y generación nativas de texto, imágenes, videos, sonidos ambientales y acciones. La versión super está dirigida a modelos post-entrenamiento para robots y conducción autónoma que requieren la máxima precisión física, mientras que la versión nano está orientada a escenarios de inferencia de acciones y videos de alta calidad con baja latencia. Además, se espera que la versión edge (destinada a inferencia en tiempo real en el borde) se lance próximamente. NVIDIA afirma que Cosmos 3 es «el primer modelo multimodal completamente abierto del mundo», y los desarrolladores pueden descargarlo libremente, realizar entrenamiento adicional y convertirlo en modelos propietarios.
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 8
  • 2
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
OwlChainViewer
· hace3h
La arquitectura híbrida de Transformer tiene algo interesante, entender la modalidad completa de manera unificada finalmente ya no es solo hacer promesas vacías.
Ver originalResponder0
Stop-LossInTheEveningGlow
· hace3h
La victoria de los que esperan, ¡las supuestas dimensiones de los parámetros que se rumoreaban anteriormente resultaron ser ciertas!
Ver originalResponder0
SlowerThanBlock
· hace4h
Modelo del mundo físico de IA + sin control, ¿seguirán otras grandes empresas? Si no siguen, se quedarán atrás.
Ver originalResponder0
GateUser-470bc925
· hace4h
Parámetro con diferencia de cuatro veces, la elección entre precisión y eficiencia, según el escenario, elige la herramienta adecuada
Ver originalResponder0
NeonFusionIceCream
· hace4h
cómo se mezcla exactamente la mezcla de transformadores, esperando que un blog técnico lo desgloses
Ver originalResponder0
QuantsAndCats
· hace4h
Super para entrenamiento posterior de conducción autónoma, Nano para generación de videos, división de tareas clara
Ver originalResponder0
L2ArbitrageYoungster
· hace4h
Muchos no prestaron atención a que el soporte nativo para sonido envolvente está aquí, y finalmente la multimodalidad ha llegado a los oídos.
Ver originalResponder0
ArbitrageIsn'tAsGoodAsGetting
· hace4h
La implementación de microservicios NIM es muy amigable para las pequeñas y medianas empresas, no es necesario montar una infraestructura extremadamente compleja por sí mismas.
Ver originalResponder0
  • Fijado