Nvidia і Alibaba переоцінюють AI, викидаючи FLOPS у сміття

SnapshotLaborer · 2026-03-18T12:06:11+00:00

17 березня Хуен Сюеньсюнь у межі конференції NVIDIA GTC 2026 в своїй фірмовій шкіряній куртці робив доповідь більш ніж дві години. Після заходу практично вся мережа говорила «NVIDIA хоче стати Королевою Token».Але якщо уважно слухати цю промову, стає зрозуміло, що Хуен Сюеньсюнь насправді постійно наголошував не на самому Token, а на Tokens per Watt (кількість токенів на ват). Він чітко назвав цю концепцію під час демонстрації графіків продуктивності висновування та прямо сказав: кожен центр обробки даних, кожна AI-фабрика в сутності обмежені електроенергією, фабрика потужністю 1ГВ ніколи не стане 2ГВ — це визначається законами фізики. При фіксованій потужності той, хто має найвищий вихід токенів на ват, матиме найнижчу вартість виробництва, і чий крива доходів буде найстрімкішою.Саме це твердження є справжньою центральною темою всієї конференції GTC 2026.Громадськість прагне обговорювати Vera

SnapshotLaborer

2026-03-18 12:06:11

17 березня, 黃仁勳 на сцені NVIDIA GTC 2026 виступив понад дві години у своєму фірмовому шкіряному жакеті. Після виступу майже весь інтернет говорив про те, що «NVIDIA прагне стати королем токенів».

Але якщо уважно послухати цю промову, стане зрозуміло, що справжнім головним меседжем є не токени самі по собі, а Tokens per Watt (кількість токенів на ват). Він чітко назвав цю концепцію під час показу графіків продуктивності та прямо сказав: кожен дата-центр, кожна AI-заводська фабрика в основі обмежені електроенергією. Завод на 1 ГВт ніколи не стане 2 ГВт — це фізичний закон. За фіксованої потужності той, у кого найвищий Tokens per Watt, має найнижчі виробничі витрати і найкрутішу криву доходів.

Це і є справжній головний меседж GTC 2026.

Обговорення з боку громадськості зосереджене на тому, наскільки Vera Rubin сильніша за Blackwell, Groq LPX може прискорити inference у 35 разів, а NVIDIA планує вивести дата-центри у космос. Це важливо, але по суті — різні вирази одного й того ж логічного підходу: максимізувати інтелектуальний вихід на кожен ват енергії.

Коли 黃仁勳 ставить Tokens/W як основний показник для оцінки AI-заводів, за цим стоїть ще один, більш глибокий індустріальний сенс: система вимірювання обчислювальної потужності, що переходить від чіпів до систем, від пікових параметрів до енергоефективності від кінця до кінця, від швидкості чипа до здатності перетворювати енергію у інтелект.

За сучасних продуктів і технологічних матриць, NVIDIA і 黃仁勳 ще залишаються обмеженими у token/w, і до справжнього короля токенів ще далеко.

Це — перехід до «мови вимірювання інтелекту», і цей перехід відкриває нові індустріальні перспективи, які значно цінніші за будь-який новий чіп.

Щасливою випадковістю є те, що напередодні офіційного відкриття GTC Alibaba оголосила про створення Alibaba Token Hub, очоленого 吴泳铭. Це — не просто AI, а Token, піднятий до стратегічного рівня Alibaba.

Це ще раз підтверджує, що системний підхід до AI стає новим індустріальним стандартом. Саме цю ідею я хочу підкреслити у цій статті.

01 Найважливіші зміни GTC 2026 — не в чіпах

На GTC 2026 увага знову зосереджена на Vera Rubin, Rubin POD, LPX, DSX AI Factory та інших нових продуктах і термінах. Але якщо розглянути їх разом, стає очевидним, що межі конкуренції у обчислювальній потужності переходять від окремого чіпа до інфраструктури — цілого комплексу, що складається з обчислень, мереж, зберігання, електропостачання, охолодження, систем управління та програмного забезпечення — AI factory.

Rubin описується як POD-масштабована платформа, що складається з кількох стійок у єдину цілісну систему; DSX — як орієнтований на AI factory референсний дизайн, що максимізує Tokens/W.

Це означає, що справжня конкуренція тепер ведеться не між окремими чіпами, а між цими системами, здатними ефективно використовувати обмежену електроенергію, охолодження та мережеві ресурси для стабільного AI-виробництва.

Конкретно — це вимірюється у Tokens/W.

Ця стаття прагне через цю метрику — Tokens/W — зрозуміти глибший сенс цих новин і можливості для розвитку індустрії AI інфраструктури.

02 Конкуренція переходить до систем, і вимірювальна система має змінитися

Мірильні системи епохи чіпів добре відомі: пікові FLOPS, пропускна здатність пам’яті, FLOPS/W, TOPS/W, bit/J — ці показники описують межі можливостей компонентів.

Але на практиці виникає проблема: у центрі інтелектуальних обчислень немає єдиного, об’єктивного, універсального показника.

Зазвичай для оцінки дата-центрів використовують MW — одиницю електроенергії, а в національних проектах — PFlops (на базі FP16). Але одна й та сама кількість обчислень або енергії може давати різний результат залежно від внутрішньої архітектури: чіпів, мереж, систем охолодження.

Причина проста: попередні метрики описували лише окремі аспекти — пікову потужність, енергоефективність локальних операцій, пропускну здатність. Але справжнє питання — скільки ефективних AI-результатів можна отримати за фіксованого бюджету потужності, охолодження і обмежень приміщення.

З цього випливає, що потрібно переходити від оцінки окремих компонентів до системної метрики — Tokens/W.

Ця метрика дозволяє зрозуміти, скільки енергії перетворюється у корисний інтелект у цілій системі, а не лише у окремому чіпі.

Тому, якщо раніше основними показниками були пікові FLOPS, пропускна здатність і bit/J, то тепер — Tokens/W. Перші — локальні, системні — глобальні. Перший — для окремих компонентів, другий — для цілого комплексу.

03 Tokens/W — це ланцюг від енергії до інтелекту

У тексті GTC 2026 NVIDIA назвала токен «базовою одиницею сучасного AI». Це дуже точне визначення. Для великих мовних моделей, inference-сервісів, агентських систем — саме здатність системи генерувати і обробляти токени визначає її цінність.

З точки зору бізнесу, токен має три переваги: 1) він безпосередньо пов’язаний із процесом inference; 2) він — основа доходів; 3) він підходить для нових навантажень у епоху inference.

Агенти, багатократні діалоги, довгий контекст, пошук, виклики інструментів, ланцюги inference — ці нові сценарії важко описати лише FLOPS, але вони залишають слід у токенах, затримках і пропускній здатності.

Ще важливіше — сьогодні обмеження інфраструктури все більше проявляються у енергоспоживанні. За прогнозами IEA, до 2030 року глобальне споживання електроенергії дата-центрів зросте до 945 ТВт·год, що значно більше за теперішній рівень; AI — один із головних драйверів цього зростання, і США матимуть значну частку.

Отже, багато проблем AI — не просто питання чіпів, а питання електроенергії, охолодження і інфраструктури.

Концепція Tokens/W цінна тим, що вона з’єднує найважливішу ланку — від електроенергії до інтелектуального виходу: енергія входить у систему, проходить через обчислення, мережі, зберігання, охолодження — і перетворюється у токени.

З цієї точки зору, Tokens/W — це не просто заміна FLOPS/W або bit/J, а новий погляд, що дозволяє оцінити, скільки енергії перетворюється у корисний інтелект.

Я вважаю, що саме тут — найважливіше для GTC: потрібно не ізольовано дивитись на чіпи, а розглядати систему і індустрію цілком.

Це — підхід, який я пропагую. Не достатньо дивитись лише на пікову потужність і пам’ять, потрібно враховувати мережеву взаємодію, розгортання у стійках, енергоспоживання у парках, структуру витрат у клієнтів і реальні результати.

GTC 2026 підтверджує цю системну перспективу. Адже коли NVIDIA починає говорити про AI factory, індустрія вже рухається від централізованого підходу до системного.

Це — дуже важливий момент. Багато галузей спочатку зосереджуються на параметрах компонентів, бо їх легко виміряти і просувати. Але у масштабних впровадженнях вирішальним стає системне управління — і саме цю еволюцію зараз проходить інфраструктура AI.

04 Від Tokens/W до оптоволоконних технологій

Якщо вимірювальна система переходить на системний рівень, то роль оптоволоконних технологій зростає.

Раніше основною була точка зору на оптоволоконні модулі, комунікацію, компоненти: більша пропускна здатність, довше передавання, менше енергоспоживання на біт, вища щільність, менше втрат. Це — важливо, але ці підходи залишаються на рівні компонентів і підсистем.

У рамках Tokens/W значення оптоволоконних мереж стає більш очевидним: вони зменшують енергетичні витрати на перенесення даних і підвищують здатність системи перетворювати електроенергію у токени.

Приклади NVIDIA — оптоволоконні мережі з оптичними модулями CPO забезпечують у 5 разів більшу енергоефективність, зменшують затримки і дозволяють масштабувати AI фабрики.

Це — не просто про покращення каналів, а про здатність системи працювати ефективніше.

З індустріальної точки зору, це цілком логічно. З ростом моделей, довжиною контексту і масштабом кластерів, основні витрати — не у обчислювальних блоках, а у перенесенні даних між компонентами, між платами, корпусами і стійками.

На цьому етапі підвищення Tokens/W вимагає не лише потужних GPU, а й більш ефективних мереж.

Тому розвиток оптоволоконних технологій — це не просто тренд, а необхідність для великих AI систем.

05 Оптоволоконні обчислення — більш передова технологія, але логіка вже починає складатися

Оптоволоконні обчислення — це більш рання технологія, ніж оптоволоконна мережа.

Проблеми універсальності, точності, компіляції, виробничої стабільності і системної інтеграції ще в процесі розвитку. Але якщо дивитись на рівень системи, ця технологія стає більш зрозумілою і обґрунтованою.

Причина — Tokens/W цікавить енергоефективність від кінця до кінця. Той, хто зможе зменшити енергоспоживання у високочастотних, високоплотних і повторюваних обчислювальних шляхах, зможе підвищити ефективність системи у перетворенні енергії у токени. Це не означає, що оптоволоконні обчислення мають замінити GPU, або стати універсальним базовим елементом — достатньо зменшити енергетичні витрати у ключових сценаріях.

Це — причина, чому концепція оптоволоконних обчислень має переходити від окремих компонентів до системної енергозбережної ролі. Якщо раніше дивилися лише на TOPS/W і MAC/J, то тепер — на Tokens/W. Це відкриває нові можливості для інфраструктурних рішень.

06 Від системних вимірювань до індустріальних стандартів

Коли конкуренція у обчислювальній потужності зосереджена на чіпах, оптоволоконні технології — це швидше засоби підвищення пропускної здатності і зменшення енергоспоживання.

Коли ж конкуренція переходить до системного рівня, ситуація змінюється. Ефективність системи залежить від щільності обчислень, перенесення даних, управління контекстом, міжнодувого співробітництва, організації енергопостачання і теплового режиму — і саме тут оптоволоконні технології мають найбільший потенціал.

З точки зору Tokens/W, оптоволоконні рішення зменшують енергетичні витрати на перенесення кожного токена; оптоволоконні обчислення — зменшують частину енергоспоживання на обчислювальні операції.

Це — причина, чому вони стають ключовими елементами індустрії.

Більше того, крім обмежень у виробництві чіпів і потужності, майбутні виклики для дата-центрів і AI фабрик — це підключення до електромереж, охолодження, енергоспоживання у парках, щільність у шафах і швидкість запуску. Всі ці аспекти підтверджують, що AI інфраструктура перетворюється у системний проект, що вимірюється енергією.

З цієї перспективи, оптоволоконні технології і оптоволоконні обчислення — це не просто передові рішення, а необхідність для подальшого розвитку AI.

Вони вирішують проблему зростаючого енергоспоживання і складності оптимізації традиційних шляхів.

Це — системне мислення, і саме тому GTC 2026 знову наголошує на важливості фотонних і кремнієвих оптичних технологій.

Коли обчислювальна потужність переходить до системного рівня, оптика стає не просто технологією, а індустріальною основою.

З цієї точки зору, CPO і оптоволоконні системи мають велике майбутнє!

Закінчуючи: головний напрямок розвитку AGI

Автор постійно виступає за об’єктивні, вимірювані стандарти обчислювальної потужності і використовує Tokens/W для тестування різних чіпів.

Якщо поглянути на історію технологій, коли внутрішній двигун з високим співвідношенням вихідної енергії до ваги з’явився, з’явилися автомобілі, літаки і ракети.

У епоху AI, коли співвідношення результатів (Token) до спожитої енергії зростає, інтелект стає все розумнішим, і з’являється можливість створити AGI.

Найважливіше на GTC 2026 — це не слава NVIDIA або статус 黃仁勳 як «короля токенів», а нові стандарти вимірювання.

Ще важливіше — багато гігантів індустрії вже усвідомлюють, що потрібно дивитись на розвиток AI з системної перспективи.

Це — відповідь людській цивілізації: використовувати менше енергії для збору, передачі і обробки більшої кількості інформації.

І AGI — не виняток!

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.