Huang Jen-Hsun GTC промова повністю: Епоха міркування настала, дохід у 2027 році становитиме щонайменше трильйон доларів, омари — нова операційна система

НVIDIA розробляє та розгортає у космосі комп’ютер для дата-центрів «Vera Rubin Space-1», що повністю відкриває уявлення про розширення AI-обчислень за межі Землі.

Джерело: Wall Street Journal

16 березня 2026 року офіційно відкрився конференція GTC 2026, засновник та генеральний директор NVIDIA Дженсен Хуанг виступив із ключовою промовою.

На цій конференції, що вважається «релігійним святом для AI-індустрії року», Хуанг окреслив трансформацію NVIDIA із «чипової компанії» у «інфраструктурну та фабричну компанію для AI». Враховуючи найактуальніші питання щодо стабільності результатів та потенціалу зростання ринку, він детально розкрив базову бізнес-логіку, що драйвить майбутній ріст — «економіку фабрик токенів».

Прогнози щодо результатів дуже оптимістичні: «до 2027 року попит складе щонайменше 1 трильйон доларів»

За останні два роки глобальний попит на AI-обчислення зріс у геометричній прогресії. З еволюцією великих моделей від «сприйняття» та «генерації» до «логіки» та «виконання завдань», споживання обчислювальної потужності стрімко зросло. Враховуючи високий інтерес ринку до обмежень замовлень та доходів, Хуанг дав дуже сильний прогноз.

У своїй промові він прямо сказав:

Минулого року я говорив, що ми бачимо високовірогідний попит у 500 мільярдів доларів, що охоплює Blackwell і Rubin до 2026 року. А зараз, саме тут і зараз, я бачу попит щонайменше 1 трильйон доларів (at least $1 trillion) до 2027 року.

Очікування Хуанга щодо трильйона разом підштовхнули ціну акцій NVIDIA зросла більш ніж на 4.3%.

Більше того, він додав:

Чи це реалістично? Саме про це я зараз і говоритиму. Насправді, попит навіть перевищує пропозицію. Я впевнений, що реальні потреби у обчислювальній потужності будуть набагато вищими.

Хуанг зазначив, що сучасні системи NVIDIA вже довели свою здатність бути найвигіднішою «інфраструктурою за ціною» у світі. Оскільки NVIDIA може запускати майже всі типи AI-моделей у різних сферах, ця універсальність дозволяє клієнтам ефективно використовувати вкладені понад 1 трильйон доларів і забезпечує довгий життєвий цикл.

Зараз 60% бізнесу NVIDIA припадає на п’ять найбільших хмарних провайдерів, решта 40% поширені серед суверенних хмар, корпорацій, промисловості, робототехніки та краєвидних обчислень.

Економіка фабрик токенів: кожен ват потужності визначає бізнес-стратегію

Щоб обґрунтувати цю логіку попиту у 1 трильйон доларів, Хуанг представив світовим керівникам нову бізнес-модель. Він зазначив, що майбутні дата-центри вже не будуть сховищами файлів, а стануть «фабриками» для виробництва токенів (базових одиниць AI).

Хуанг підкреслив:

Кожен дата-центр, кожна фабрика за визначенням обмежена електропостачанням. Фабрика потужністю 1 ГВт (гігават) ніколи не стане 2 ГВт — це фізичні та атомні закони. За фіксованої потужності, той, хто має найвищий вивід токенів на кожен ват, має найнижчі виробничі витрати.

Хуанг розділив майбутні AI-сервіси на чотири бізнес-рівні:

  • Безкоштовний рівень (висока пропускна здатність, низька швидкість)
  • Середній рівень (~3 долари за мільйон токенів)
  • Преміум рівень (~6 доларів за мільйон токенів)
  • Високошвидкісний рівень (~45 доларів за мільйон токенів)
  • Надвисокошвидкісний рівень (~150 доларів за мільйон токенів)

Він зазначив, що з ростом розмірів моделей і довжиною контексту AI стає розумнішим, але швидкість генерації токенів зменшується. Хуанг сказав:

У цьому фабричному процесі ваш пропускний здатність і швидкість генерації токенів безпосередньо впливають на ваші доходи наступного року.

Хуанг наголосив, що архітектура NVIDIA дозволяє клієнтам досягати високих показників пропускної здатності на безкоштовному рівні, а на рівні найвищої цінності — підвищувати продуктивність у 35 разів.

Vera Rubin за два роки прискорилася у 350 разів, а компанія Groq заповнює прогалину у швидкому логічному виведенні

За фізичних обмежень, NVIDIA представила свою найскладнішу систему AI — Vera Rubin. Хуанг сказав:

Раніше я показував Hopper, тримав чип — це мило. Але коли говорю про Vera Rubin, маю на увазі всю систему. У цій системі, що повністю охолоджується рідиною і позбавлена традиційних кабелів, раніше потрібно було два дні для монтажу стійки, тепер — всього два години.

Хуанг підкреслив, що за допомогою максимальної координації апаратного та програмного забезпечення Vera Rubin створила неймовірний прорив у швидкості генерації токенів:

За два роки ми підвищили швидкість генерації токенів з 22 мільйонів до 700 мільйонів — у 350 разів. Закон Мура тоді дає лише 1.5-кратне зростання.

Щоб подолати вузькі місця у швидкому логічному виведенні (наприклад, 1000 токенів/сек), NVIDIA запропонувала інтеграцію купівлі компанії Groq: асиметричне розділення логіки виведення. Хуанг пояснив:

Ці два процесори мають різні характеристики. Чип Groq має 500 МБ SRAM, а Rubin — 288 ГБ пам’яті.

Хуанг зазначив, що за допомогою програмної системи Dynamo, яка інтегрує куплену компанію Groq, обробляються етапи «передзаповнення» (Pre-fill) і «декодування» (Decoding). Він додав:

Ці етапи, що потребують великої обчислювальної потужності і пам’яті KV Cache, виконуються на Vera Rubin, тоді як етап «декодування» — на Groq, що вимагає високої пропускної здатності та низької затримки.

Об’єднання цих двох систем через Ethernet і спеціальні режими зменшує затримки приблизно удвічі. Завдяки єдиному управлінню Dynamo, загальна продуктивність зросла у 35 разів і відкрила нові рівні логічного виведення, раніше недоступні для NVLink 72.

Рекомендації щодо використання Groq і Vera Rubin:

  • Якщо навантаження переважно високопропускне, використовувати 100% Vera Rubin
  • Якщо потрібно багато високоякісних токенів, генерованих для кодування, — залучити Groq, приблизно 25% від обсягу дата-центру

Згідно з інформацією, чип LP30 компанії Samsung, створений для Groq, вже серійно виробляється і планується поставка у Q3, а перша стійка Vera Rubin вже працює у хмарі Microsoft Azure.

Крім того, NVIDIA представила перший у світі масовий випуск оптичного комутатора CPO Spectrum X, що зняв напругу у суперечках щодо «мідь проти оптики»:

Нам потрібно більше виробництва кабелів із міді, більше оптичних чипів і більше CPO.

Agent: новий стандарт у SaaS — «річний токен + зарплата»

Крім апаратних обмежень, Хуанг багато уваги приділив революції у програмному забезпеченні AI та екосистемі, зокрема — появі Agent (інтелектуальних агентів).

Він назвав проект OpenClaw «найпопулярнішим відкритим проектом у людській історії», що за кілька тижнів перевершив досягнення Linux за 30 років. Хуанг прямо сказав, що OpenClaw — це «операційна система» для агентних комп’ютерів.

Хуанг стверджує:

Кожна SaaS-компанія стане AaaS (Agent-as-a-Service, інтелектуальні агенти як сервіс). Щоб безпечно реалізувати таких агентів, що мають доступ до конфіденційних даних і виконують код, NVIDIA створила корпоративний зразок NeMo Claw, що додав механізми політик і приватних маршрутів.

Для звичайних працівників ця революція вже близько. Хуанг описав майбутній новий формат роботи:

У майбутньому кожен інженер нашої компанії матиме щорічний бюджет токенів. Їхня базова зарплата може становити кілька сотень тисяч доларів, а я додам ще приблизно половину цієї суми у вигляді токенів, щоб підвищити їхню продуктивність у 10 разів. «Кількість токенів у пропозиції при працевлаштуванні» вже стала новим рекрутинговим трендом у Кремнієвій долині: скільки токенів у вашій пропозиції?

У майбутньому кожна компанія буде одночасно і споживачем, і виробником токенів — для інженерів і для клієнтів. OpenClaw — це не просто технологія, а новий рівень у розвитку індустрії.

NVIDIA відкриває модельний підхід

Щодо кастомних агентів (Custom Claw), NVIDIA пропонує власну передову модель:

Nemotron — великий мовний модель Cosmos — базова модель світу GROOT — універсальний робот-людина Alpamayo — автономне водіння BioNeMo — цифрова біологія Phys-AI — фізика

Ми працюємо у кожній галузі на передовій і обіцяємо постійне оновлення — після Nemotron 3 буде Nemotron 4, після Cosmos 1 — Cosmos 2, а Groq перейде до другого покоління.

Nemotron 3 у OpenClaw — один із трьох найкращих моделей у світі, на передовій. Nemotron 3 Ultra стане найпотужнішою базовою моделлю, що дозволить країнам створювати власні суверенні AI.

Сьогодні ми оголосили про створення альянсу Nemotron, що інвестує десятки мільярдів доларів у розробку AI-базових моделей. Учасники альянсу: BlackForest Labs, Cursor, LangChain, Mistral, Perplexity, Reflection, Sarvam (Індія), Thinking Machines (лабораторія Міри Мураті) та інші. Багато компаній-розробників програмного забезпечення вже інтегрують NeMo Claw і NVIDIA AI інструменти у свої продукти.

Фізичний AI і робототехніка

Цифрові агенти діють у цифровому світі — пишуть код, аналізують дані; фізичний AI — це тілесні агенти, тобто роботи.

На цій GTC представлено 110 роботів, що охоплюють майже всі провідні компанії у цій галузі. NVIDIA забезпечує три комп’ютери (для тренувань, симуляцій і роботів) і повний стек програмного забезпечення та AI-моделей.

У сфері автономного водіння вже настав час «генеративного AI». Сьогодні ми оголосили про нових партнерів у платформі RoboTaxi Ready: BYD, Hyundai, Nissan, Geely, загалом — 18 мільйонів машин на рік. У сумі з Mercedes, Toyota, GM, — це ще більше. Також ми уклали важливу угоду з Uber щодо розгортання та інтеграції RoboTaxi у кількох містах.

У промисловій робототехніці співпрацюємо з ABB, Universal Robotics, KUKA та іншими, щоб поєднати фізичні AI-моделі з симуляційними системами і просувати роботів на світових виробничих лініях.

У телекомунікаціях — компанія Caterpillar і T-Mobile. Майбутні базові станції вже не просто комунікаційні вузли, а AI-інфраструктура — NVIDIA Aerial RAN, що здатна в реальному часі аналізувати трафік і налаштовувати промені для енергозбереження та підвищення ефективності.

Особливий блок: демонстрація робота Olaf

(відео демонстрації робота Disney Olaf)

Хуанг: Зустрічайте сніговика! Newton працює! Omniverse працює! Olaf, як ти?

Olaf: Дуже радий тебе бачити.

Хуанг: Так, бо я дав тобі комп’ютер — Jetson!

Olaf: Що це?

Хуанг: Це у тебе в животі.

Olaf: Це неймовірно.

Хуанг: Ти навчився ходити у Omniverse.

Olaf: Мені подобається ходити. Це набагато краще, ніж їхати на олені і милуватися небом.

Хуанг: Це завдяки фізичному моделюванню — Newton, що працює на NVIDIA Warp, розроблений у співпраці з Disney і DeepMind, щоб ти міг адаптуватися до реального фізичного світу.

Olaf: Саме я хотів сказати.

Хуанг: Це твоя розумність. Я — сніговик, а не сніжок.

Хуанг: Можеш уявити? Майбутній Діснейленд — усі ці герої-роботи вільно гуляють по парку. Але чесно кажучи, я думав, ти буде вищий. Я ніколи не бачив такого низького сніговика.

Olaf: (мовчки)

Хуанг: Давай допоможу тобі завершити сьогоднішній виступ?

Olaf: З задоволенням!

Підсумки основної промови

Хуанг: Сьогодні ми обговорили ключові теми:

  1. Наступ логіки логічного виведення: логіка виведення стала найважливішим навантаженням AI, токен — новий товар, продуктивність визначає дохід
  2. Епоха AI-фабрик: дата-центри перетворилися з сховищ файлів у фабрики токенів, і в майбутньому кожна компанія оцінюватиме свою конкурентоспроможність за «ефективністю AI-фабрики»
  3. Революція Agent (інтелектуальних агентів): відкрила еру агентних обчислень, кожна компанія має розробити свою стратегію OpenClaw
  4. Фізичний AI і роботи: тілесний інтелект стає масштабним, автоматизація водіння, промислові роботи, гуманоїдні роботи — це нові великі можливості

Дякую всім, гарної GTC!

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити