Nvidia выпустила мощную открытую модель Nemotron 3 Ultra!
Фокус на AI-агентских задачах, производительность выросла в 5 раз, затраты снизились на 30%

Чиповый гигант NVIDIA сегодня (4-го числа) объявил о запуске нового открытого флагманского модели «Nemotron 3 Ultra». Эта модель специально разработана для длительной работы AI-агентов (AI Agents) и сложных многопроцессных рабочих потоков, обладает до 550 миллиардами параметров. Благодаря внедрению гибридной архитектуры и ряду технологических инноваций, Nemotron 3 Ultra показывает отличные результаты во многих бенчмарках, обеспечивая до 5-кратное увеличение пропускной способности и снижая стоимость задач агентов на 30%.
(Предыстория: Nvidia инвестирует 400 миллионов долларов в приобретение Kumo AI! Дополняет «пазл корпоративных предсказательных моделей», ускоряя трансформацию в универсального AI-гиганта)
(Дополнительный фон: Nvidia объединяется с китайским стартапом YuShu Technology Unitree! Хуанг Жэньхун продвигает «платформу AI для гуманоидных роботов», нацеливаясь на многотриллионный рынок физических AI)

Содержание статьи

Переключить

  • 55 миллиардов активных параметров, превращаясь в «мозг» AI-рабочих потоков
  • Пять технологических инноваций: рост пропускной способности в 5 раз, снижение затрат на 30%
  • Полностью открытый исходный код, ускоряя внедрение корпоративных AI-приложений

В условиях тенденции к высокой автоматизации и сложным рабочим потокам в области искусственного интеллекта (AI), вычислительные издержки и узкие места эффективности «многопроцессных систем» становятся главной проблемой при внедрении AI в крупные компании. Для решения этой задачи, NVIDIA 4 июня 2026 года официально представила флагманский продукт семейства Nemotron 3 — Nemotron 3 Ultra.

Это мощная открытая модель, специально созданная для «длительно работающих AI-агентов». В традиционных многопроцессных рабочих потоках из-за необходимости постоянного планирования, вызова инструментов, делегирования субагентов и поддержания длинных контекстов, расход токенов (Token) резко возрастает, что ведет к высоким затратам и отклонениям от целей. Nemotron 3 Ultra создана для преодоления этих проблем.

55 миллиардов активных параметров, превращаясь в «мозг» AI-рабочих потоков

Nemotron 3 Ultra использует архитектуру «смесь экспертов» (Mixture-of-Experts, MoE), общий объем параметров достигает 550 миллиардов, однако при каждом вычислении активными являются только 55 миллиардов, что обеспечивает максимальную эффективность работы. В многопроцессных рабочих потоках эта модель позиционируется как «оркестратор» или передовой движок рассуждений, предназначенный для обработки глубокого планирования, сложного комплексного анализа и логической проверки, выполняя при этом рутинные задачи и вызовы инструментов легкими моделями.

По показателям эффективности, Nemotron 3 Ultra показывает выдающиеся результаты во многих бенчмарках, ориентированных на AI-агентов. Например, в производительности агентов (PinchBench) она набрала 91%, в долгосрочном планировании (EnterpriseOps-Gym) и кодогенерации (Terminal-Bench 2.0) достигла 40% и 67% соответственно. Несмотря на меньший объем активных параметров, её общие возможности рассуждения превосходят или сравнимы с крупными открытыми моделями на рынке, такими как GLM 5.1, Kimi K2.6 и Qwen3.5.

Пять технологических инноваций: рост пропускной способности в 5 раз, снижение затрат на 30%

Для достижения такой высокой производительности и скорости NVIDIA внедрила в Nemotron 3 Ultra пять ключевых технологических инноваций. Во-первых, «гибридный слой Mamba-Transformer», который сочетает эффективность обработки длинных последовательностей Mamba и точность фактического восстановления Transformer. Во-вторых, поддержка «NVFP4 квантования», позволяющая без швов внедрять веса модели на GPU архитектур Hopper, Blackwell и Ampere, что по сравнению с традиционным форматом BF16 увеличивает пропускную способность на Blackwell до 5 раз (скорость вывода).

Кроме того, модель интегрирует LatentMoE (эффективный маршрутизатор экспертов для сложных нагрузок), предсказание нескольких токенов (MTP, предсказывает сразу несколько будущих токенов для ускорения генерации длинных текстов), а также онлайн-дистилляцию с несколькими учителями (MOPD) и другие передовые технологии. Эти инновации значительно снижают общее потребление токенов при выполнении задач, что позволяет снизить затраты на задачи агентов в компаниях до 30%.

Полностью открытый исходный код, ускоряя внедрение корпоративных AI-приложений

В части обучающих данных, Nemotron 3 Ultra основана на более чем 10 триллионах токенов для предобучения, дополнительно включающего свыше 212 миллиарда специализированных токенов из различных областей (юридические документы, тексты в стиле Википедии и последние коды GitHub). NVIDIA подчеркивает, что модель полностью открыта, использует гибкую лицензию OpenMDW-1.1 и предоставляет сообществу полный доступ к весам модели, обучающим рецептам и данным.

На данный момент разработчики могут получить и развернуть Nemotron 3 Ultra на популярных платформах, таких как Hugging Face, NVIDIA Build и NIM. Благодаря превосходным возможностям обработки длинных текстов (в тесте Ruler @1M достигла 95%) и высокой стоимости эффективности, ожидается, что эта модель станет мощным инструментом для автоматизации клиентского сервиса, управления цепочками поставок, информационной безопасности и проверки чипов.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено