NVIDIA Cosmos 3 физическая модель AI мира сегодня официально открыта для загрузки, две версии доступны на HuggingFace

Блокчейн-новости, Nvidia сегодня официально запустила загрузку моделей мира Cosmos 3 для физического AI, выпустив первые версии super (646 миллиардов параметров) и nano (157 миллиардов параметров), которые уже доступны на HuggingFace (без ограничений, можно скачивать напрямую) и build.nvidia.com, а также поддерживают развертывание в виде микросервисов NVIDIA NIM. Cosmos 3 позиционируется как универсальная базовая модель мира для физического AI (omnimodel), основанная на новой гибридной архитектуре трансформеров (mixture of transformers), которая изначально понимает и генерирует текст, изображения, видео, окружающие звуки и действия. Версия super предназначена для задач с максимально высокой физической точностью, таких как дообученные роботы и системы автономного вождения, версия nano — для низколатентных сценариев с высококачественным видео и выводом действий. Кроме того, версия для периферийных устройств (нацелена на реальное время на периферии) ожидается в ближайшее время. Nvidia заявила, что Cosmos 3 — «первый в мире полностью открытый универсальный мультимодальный модел», разработчики могут свободно скачивать, дообучать и преобразовывать его в собственные модели.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 8
  • 2
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
OwlChainViewer
· 3ч назад
Гибридная архитектура Transformer имеет свои преимущества, полное унифицированное понимание мультимодальности наконец-то перестало быть пустыми обещаниями
Посмотреть ОригиналОтветить0
Stop-LossInTheEveningGlow
· 3ч назад
Победа долгожданных, параметры, о которых ранее ходили слухи, оказались действительно правдой
Посмотреть ОригиналОтветить0
SlowerThanBlock
· 4ч назад
Физическая модель мира AI + без门控, другие крупные компании последуют или нет?
Если не последуют, отстанут.
Посмотреть ОригиналОтветить0
GateUser-470bc925
· 4ч назад
Параметр в четыре раза меньше, баланс между точностью и эффективностью — выбирайте инструмент в зависимости от ситуации
Посмотреть ОригиналОтветить0
NeonFusionIceCream
· 4ч назад
как именно смешивается смесь трансформеров, разбор в техническом блоге
Посмотреть ОригиналОтветить0
QuantsAndCats
· 4ч назад
Автоматизированное обучение после тренировки использует super, генерация видео — nano, четкое распределение обязанностей
Посмотреть ОригиналОтветить0
L2ArbitrageYoungster
· 4ч назад
Многие не обращали внимания на поддержку пространственного звука изначально, а мультимодальность наконец-то дошла до ушей.
Посмотреть ОригиналОтветить0
ArbitrageIsn'tAsGoodAsGetting
· 4ч назад
Развертывание микросервисов NIM очень удобно для малых и средних предприятий, не нужно самостоятельно создавать сложную инфраструктуру
Посмотреть ОригиналОтветить0
  • Закреплено