NVIDIA физическая AI-модель вывода Cosmos-Reason2 с открытым исходным кодом 32B флагманские веса

Согласно мониторингу Beating, NVIDIA открыл веса модели Cosmos-Reason2-32B.
Cosmos Reason 2 — это модель физического ИИ для логического вывода и визуального языка, выпущенная NVIDIA в конце прошлого года (VLM, модель, одновременно обрабатывающая изображения, видео и текст), специально обученная для понимания пространственных, временных и физических законов.
На тот момент были доступны только две версии с 2 миллиардами и 8 миллиардами параметров, а флагманская версия с 32 миллиардами параметров впервые стала публичной только сейчас.
Базовая модель — Qwen3-VL-32B-Instruct от 通义千问, лицензия NVIDIA Open Model License, допускающая коммерческое использование.

Дайте ей видеозапись с движением, она сможет смотреть и делать выводы о безопасности правого поворота;
Дайте ей фотографию склада, она сможет указать 2D/3D координаты и границы каждого предмета.
Основные направления использования: анализ видеопотоков городских и промышленных сцен, массовая разметка данных с датчиков, создание планировочного мозга для гуманоидных роботов и автономных транспортных средств.
По сравнению с предыдущим поколением добавлены обнаружение целей и точное определение временных меток, окно контекста расширено до 256K токенов.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено