Переглядаю останні кроки NVIDIA у сфері корпоративного штучного інтелекту, і це варто враховувати. Вони щойно випустили Nemotron 3 Super — модель з 120 мільярдами параметрів, спеціально розроблену для агентних AI-робочих процесів, і час випуску говорить про те, куди спрямовані справжні гроші.



Ось що привернуло мою увагу: основна проблема, яку вони вирішують, досить специфічна для роботи мультиагентних систем у виробництві. Коли ви запускаєте кілька AI-агентів, які мають координуватися, ви швидко стикаєтеся з цим бар’єром. Взаємодія кожного агента відновлює повну історію розмов, вихідні дані інструментів, ланцюги міркувань — це збільшує використання токенів у 15 разів порівняно з простими чатботами. Це стає дорогим при масштабуванні на рівні підприємства. Nemotron 3 Super вирішує цю проблему за допомогою контекстного вікна на 1 мільйон токенів, що дозволяє агентам зберігати цілі стани робочих процесів без постійної переробки.

Вибір архітектури тут важливіший за основні характеристики. Вони використовують гібридний дизайн з експертами, де під час інференції активні лише 12 мільярдів параметрів із загалом 120 мільярдів. Ефективність зростає — у поєднанні з багатотоковим прогнозуванням вони стверджують про тричі швидше інференцію. На обладнанні Blackwell це дає 4-кратне прискорення порівняно з попереднім поколінням без зниження точності.

Що справді показово — це список впроваджень. Perplexity одразу інтегрувала його. CodeRabbit, Factory і Greptile вже використовують його у своїх AI-агентах для кодування. Але більш цікава промислова частина — Siemens, Dassault Systèmes і Cadence для виробництва та автоматизації проектування. Palantir і Amdocs — для кібербезпеки та телекомунікацій. Це не просто хайп; це підприємства, які впроваджують агентські системи для реальних робочих процесів.

Доступність у хмарі поширюється через Google Cloud, Oracle, а AWS і Azure незабаром з’являться. Постачальники інференції, такі як Fireworks AI і DeepInfra, вже його підтримують. Це важливо, оскільки сигналізує про впевненість у стабільному попиті.

Що особливо вразило — NVIDIA відкрила вихідний код із вагами та понад 10 трильйонами токенів навчальних даних. Це стратегічний хід — ви не просто продаєте моделі, а створюєте екосистему, де Blackwell стає стандартним обладнанням для запуску корпоративного агентного AI. Модель очолила рейтинг ефективності Artificial Analysis, що підтверджує інженерну якість.

Для інвесторів, які слідкують за цим, Nemotron 3 Super швидше про те, куди рухається NVIDIA у сфері корпоративного AI — до спеціалізованих агентних систем, що вимагають серйозних обчислень. Основне питання — чи перетворяться ці впровадження на стабільний попит на Blackwell до кінця 2026 року. Перші ознаки свідчать, що так і буде.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити