NVIDIA фізична модель штучного інтелекту для логіки Cosmos-Reason2 з відкритим кодом, флагманські ваги 32B

Згідно з моніторингом Beating, NVIDIA відкрила ваги моделі Cosmos-Reason2-32B.
Cosmos Reason 2 — це фізична AI-інтелектуальна модель розуміння візуального мови (VLM), яка була випущена NVIDIA наприкінці минулого року (одночасно обробляє зображення, відео та текст), спеціально для навчання роботів та систем автоматичного водіння розуміти простір, час і базові фізичні закони.
Тоді були відкриті лише дві малі версії ваг — з 2 мільярдами та 8 мільярдами параметрів, а флагманська версія з 320 мільярдами параметрів вперше стала доступною лише зараз.
Базова модель — Qwen3-VL-32B-Instruct від 通义千问, ліцензія NVIDIA Open Model License дозволяє комерційне використання.

Надійте їй відеозапис руху автомобіля, і вона зможе одночасно дивитись і робити висновки щодо безпеки правого повороту;
Дайте їй фотографію складу, і вона зможе позначити 2D/3D координати та рамки кожного вантажу.
Основні сфери застосування — три напрямки: аналіз відеопотоків міських та промислових сцен, пакетне маркування даних сенсорів, а також використання як планувальний мозок для гуманоїдних роботів і систем автоматичного водіння.
Порівняно з попереднім поколінням, додано виявлення цілей та точне визначення часових міток, а вікно контексту розширено до 256K токенів.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити