Nvidia Cosmos 3 фізична модель світу AI сьогодні офіційно відкрила для завантаження, обидві версії доступні на HuggingFace

Бюлетень CoinWorld повідомляє, що NVIDIA сьогодні офіційно відкрила завантаження моделей ваг для Cosmos 3 — фізичної AI світової моделі.
Перші випуски включають два варіанти: super (646 мільярдів параметрів) та nano (157 мільярдів параметрів), обидва вже доступні на HuggingFace (без обмежень, можна завантажувати безпосередньо) та build.nvidia.com, а також підтримують розгортання у вигляді мікросервісів NVIDIA NIM.
Cosmos 3 позиціонується як універсальна базова модель світового фізичного AI (omnimodel), побудована на новій гібридній архітектурі трансформерів (mixture of transformers), що нативно розуміє та генерує текст, зображення, відео, звуки навколишнього середовища та дії.
Версія super орієнтована на високоточні фізичні моделі для донавчання роботів та систем автопілоту, а nano — для низької затримки у сценаріях високоякісного відео та логіки дій.
Крім того, версія для краю (edge), орієнтована на реальновремінне розгортання на периферії, очікується найближчим часом.
NVIDIA заявляє, що Cosmos 3 є «першою у світі повністю відкритою універсальною модальною моделлю», яку розробники можуть безкоштовно завантажувати, донавчати та перетворювати у власні моделі.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 8
  • 2
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
OwlChainViewer
· 3год тому
Змішана архітектура Transformer має дещо, єдине розуміння усіх модальностей нарешті перестало бути порожніми обіцянками
Переглянути оригіналвідповісти на0
Stop-LossInTheEveningGlow
· 3год тому
Перемога довгострокових інвесторів, раніше поширювані чутки про масштаб параметрів виявилися правдою
Переглянути оригіналвідповісти на0
SlowerThanBlock
· 4год тому
Фізична модель світу AI + без керування, чи йдуть інші великі компанії за цим? Не йдуть — відстануть.
Переглянути оригіналвідповісти на0
GateUser-470bc925
· 4год тому
Параметр у чотири рази різний, компроміс між точністю та ефективністю — вибір залежить від сценарію
Переглянути оригіналвідповісти на0
NeonFusionIceCream
· 4год тому
як саме змішується суміш трансформерів, очікуйте розбір у технічних блогах
Переглянути оригіналвідповісти на0
QuantsAndCats
· 4год тому
Автоматичне водіння — для подальшого навчання використовують Super, для генерації відео — Nano, чіткий розподіл обов’язків
Переглянути оригіналвідповісти на0
L2ArbitrageYoungster
· 4год тому
Багато людей не звернули уваги на підтримку оригінального просторового звуку, тепер мультимодальність нарешті "приміряла" його.
Переглянути оригіналвідповісти на0
ArbitrageIsn'tAsGoodAsGetting
· 4год тому
Розгортання мікросервісів NIM дуже зручно для малих і середніх підприємств, не потрібно самостійно створювати складну інфраструктуру
Переглянути оригіналвідповісти на0
  • Закріплено