Nvidia і Alibaba переоцінюють AI, викидаючи FLOPS у сміття

17 березня, 黃仁勳 на сцені NVIDIA GTC 2026 виступив понад дві години у своєму фірмовому шкіряному жакеті. Після виступу майже весь інтернет говорив про те, що «NVIDIA прагне стати королем токенів».

Але якщо уважно послухати цю промову, стане зрозуміло, що справжнім головним меседжем є не токени самі по собі, а Tokens per Watt (кількість токенів на ват). Він чітко назвав цю концепцію під час показу графіків продуктивності та прямо сказав: кожен дата-центр, кожна AI-заводська фабрика в основі обмежені електроенергією. Завод на 1 ГВт ніколи не стане 2 ГВт — це фізичний закон. За фіксованої потужності той, у кого найвищий Tokens per Watt, має найнижчі виробничі витрати і найкрутішу криву доходів.

Це і є справжній головний меседж GTC 2026.

Обговорення з боку громадськості зосереджене на тому, наскільки Vera Rubin сильніша за Blackwell, Groq LPX може прискорити inference у 35 разів, а NVIDIA планує вивести дата-центри у космос. Це важливо, але по суті — різні вирази одного й того ж логічного підходу: максимізувати інтелектуальний вихід на кожен ват енергії.

Коли 黃仁勳 ставить Tokens/W як основний показник для оцінки AI-заводів, за цим стоїть ще один, більш глибокий індустріальний сенс: система вимірювання обчислювальної потужності, що переходить від чіпів до систем, від пікових параметрів до енергоефективності від кінця до кінця, від швидкості чипа до здатності перетворювати енергію у інтелект.

За сучасних продуктів і технологічних матриць, NVIDIA і 黃仁勳 ще залишаються обмеженими у token/w, і до справжнього короля токенів ще далеко.

Це — перехід до «мови вимірювання інтелекту», і цей перехід відкриває нові індустріальні перспективи, які значно цінніші за будь-який новий чіп.

Щасливою випадковістю є те, що напередодні офіційного відкриття GTC Alibaba оголосила про створення Alibaba Token Hub, очоленого 吴泳铭. Це — не просто AI, а Token, піднятий до стратегічного рівня Alibaba.

Це ще раз підтверджує, що системний підхід до AI стає новим індустріальним стандартом. Саме цю ідею я хочу підкреслити у цій статті.

01 Найважливіші зміни GTC 2026 — не в чіпах

На GTC 2026 увага знову зосереджена на Vera Rubin, Rubin POD, LPX, DSX AI Factory та інших нових продуктах і термінах. Але якщо розглянути їх разом, стає очевидним, що межі конкуренції у обчислювальній потужності переходять від окремого чіпа до інфраструктури — цілого комплексу, що складається з обчислень, мереж, зберігання, електропостачання, охолодження, систем управління та програмного забезпечення — AI factory.

Rubin описується як POD-масштабована платформа, що складається з кількох стійок у єдину цілісну систему; DSX — як орієнтований на AI factory референсний дизайн, що максимізує Tokens/W.

Це означає, що справжня конкуренція тепер ведеться не між окремими чіпами, а між цими системами, здатними ефективно використовувати обмежену електроенергію, охолодження та мережеві ресурси для стабільного AI-виробництва.

Конкретно — це вимірюється у Tokens/W.

Ця стаття прагне через цю метрику — Tokens/W — зрозуміти глибший сенс цих новин і можливості для розвитку індустрії AI інфраструктури.

02 Конкуренція переходить до систем, і вимірювальна система має змінитися

Мірильні системи епохи чіпів добре відомі: пікові FLOPS, пропускна здатність пам’яті, FLOPS/W, TOPS/W, bit/J — ці показники описують межі можливостей компонентів.

Але на практиці виникає проблема: у центрі інтелектуальних обчислень немає єдиного, об’єктивного, універсального показника.

Зазвичай для оцінки дата-центрів використовують MW — одиницю електроенергії, а в національних проектах — PFlops (на базі FP16). Але одна й та сама кількість обчислень або енергії може давати різний результат залежно від внутрішньої архітектури: чіпів, мереж, систем охолодження.

Причина проста: попередні метрики описували лише окремі аспекти — пікову потужність, енергоефективність локальних операцій, пропускну здатність. Але справжнє питання — скільки ефективних AI-результатів можна отримати за фіксованого бюджету потужності, охолодження і обмежень приміщення.

З цього випливає, що потрібно переходити від оцінки окремих компонентів до системної метрики — Tokens/W.

Ця метрика дозволяє зрозуміти, скільки енергії перетворюється у корисний інтелект у цілій системі, а не лише у окремому чіпі.

Тому, якщо раніше основними показниками були пікові FLOPS, пропускна здатність і bit/J, то тепер — Tokens/W. Перші — локальні, системні — глобальні. Перший — для окремих компонентів, другий — для цілого комплексу.

03 Tokens/W — це ланцюг від енергії до інтелекту

У тексті GTC 2026 NVIDIA назвала токен «базовою одиницею сучасного AI». Це дуже точне визначення. Для великих мовних моделей, inference-сервісів, агентських систем — саме здатність системи генерувати і обробляти токени визначає її цінність.

З точки зору бізнесу, токен має три переваги: 1) він безпосередньо пов’язаний із процесом inference; 2) він — основа доходів; 3) він підходить для нових навантажень у епоху inference.

Агенти, багатократні діалоги, довгий контекст, пошук, виклики інструментів, ланцюги inference — ці нові сценарії важко описати лише FLOPS, але вони залишають слід у токенах, затримках і пропускній здатності.

Ще важливіше — сьогодні обмеження інфраструктури все більше проявляються у енергоспоживанні. За прогнозами IEA, до 2030 року глобальне споживання електроенергії дата-центрів зросте до 945 ТВт·год, що значно більше за теперішній рівень; AI — один із головних драйверів цього зростання, і США матимуть значну частку.

Отже, багато проблем AI — не просто питання чіпів, а питання електроенергії, охолодження і інфраструктури.

Концепція Tokens/W цінна тим, що вона з’єднує найважливішу ланку — від електроенергії до інтелектуального виходу: енергія входить у систему, проходить через обчислення, мережі, зберігання, охолодження — і перетворюється у токени.

З цієї точки зору, Tokens/W — це не просто заміна FLOPS/W або bit/J, а новий погляд, що дозволяє оцінити, скільки енергії перетворюється у корисний інтелект.

Я вважаю, що саме тут — найважливіше для GTC: потрібно не ізольовано дивитись на чіпи, а розглядати систему і індустрію цілком.

Це — підхід, який я пропагую. Не достатньо дивитись лише на пікову потужність і пам’ять, потрібно враховувати мережеву взаємодію, розгортання у стійках, енергоспоживання у парках, структуру витрат у клієнтів і реальні результати.

GTC 2026 підтверджує цю системну перспективу. Адже коли NVIDIA починає говорити про AI factory, індустрія вже рухається від централізованого підходу до системного.

Це — дуже важливий момент. Багато галузей спочатку зосереджуються на параметрах компонентів, бо їх легко виміряти і просувати. Але у масштабних впровадженнях вирішальним стає системне управління — і саме цю еволюцію зараз проходить інфраструктура AI.

04 Від Tokens/W до оптоволоконних технологій

Якщо вимірювальна система переходить на системний рівень, то роль оптоволоконних технологій зростає.

Раніше основною була точка зору на оптоволоконні модулі, комунікацію, компоненти: більша пропускна здатність, довше передавання, менше енергоспоживання на біт, вища щільність, менше втрат. Це — важливо, але ці підходи залишаються на рівні компонентів і підсистем.

У рамках Tokens/W значення оптоволоконних мереж стає більш очевидним: вони зменшують енергетичні витрати на перенесення даних і підвищують здатність системи перетворювати електроенергію у токени.

Приклади NVIDIA — оптоволоконні мережі з оптичними модулями CPO забезпечують у 5 разів більшу енергоефективність, зменшують затримки і дозволяють масштабувати AI фабрики.

Це — не просто про покращення каналів, а про здатність системи працювати ефективніше.

З індустріальної точки зору, це цілком логічно. З ростом моделей, довжиною контексту і масштабом кластерів, основні витрати — не у обчислювальних блоках, а у перенесенні даних між компонентами, між платами, корпусами і стійками.

На цьому етапі підвищення Tokens/W вимагає не лише потужних GPU, а й більш ефективних мереж.

Тому розвиток оптоволоконних технологій — це не просто тренд, а необхідність для великих AI систем.

05 Оптоволоконні обчислення — більш передова технологія, але логіка вже починає складатися

Оптоволоконні обчислення — це більш рання технологія, ніж оптоволоконна мережа.

Проблеми універсальності, точності, компіляції, виробничої стабільності і системної інтеграції ще в процесі розвитку. Але якщо дивитись на рівень системи, ця технологія стає більш зрозумілою і обґрунтованою.

Причина — Tokens/W цікавить енергоефективність від кінця до кінця. Той, хто зможе зменшити енергоспоживання у високочастотних, високоплотних і повторюваних обчислювальних шляхах, зможе підвищити ефективність системи у перетворенні енергії у токени. Це не означає, що оптоволоконні обчислення мають замінити GPU, або стати універсальним базовим елементом — достатньо зменшити енергетичні витрати у ключових сценаріях.

Це — причина, чому концепція оптоволоконних обчислень має переходити від окремих компонентів до системної енергозбережної ролі. Якщо раніше дивилися лише на TOPS/W і MAC/J, то тепер — на Tokens/W. Це відкриває нові можливості для інфраструктурних рішень.

06 Від системних вимірювань до індустріальних стандартів

Коли конкуренція у обчислювальній потужності зосереджена на чіпах, оптоволоконні технології — це швидше засоби підвищення пропускної здатності і зменшення енергоспоживання.

Коли ж конкуренція переходить до системного рівня, ситуація змінюється. Ефективність системи залежить від щільності обчислень, перенесення даних, управління контекстом, міжнодувого співробітництва, організації енергопостачання і теплового режиму — і саме тут оптоволоконні технології мають найбільший потенціал.

З точки зору Tokens/W, оптоволоконні рішення зменшують енергетичні витрати на перенесення кожного токена; оптоволоконні обчислення — зменшують частину енергоспоживання на обчислювальні операції.

Це — причина, чому вони стають ключовими елементами індустрії.

Більше того, крім обмежень у виробництві чіпів і потужності, майбутні виклики для дата-центрів і AI фабрик — це підключення до електромереж, охолодження, енергоспоживання у парках, щільність у шафах і швидкість запуску. Всі ці аспекти підтверджують, що AI інфраструктура перетворюється у системний проект, що вимірюється енергією.

З цієї перспективи, оптоволоконні технології і оптоволоконні обчислення — це не просто передові рішення, а необхідність для подальшого розвитку AI.

Вони вирішують проблему зростаючого енергоспоживання і складності оптимізації традиційних шляхів.

Це — системне мислення, і саме тому GTC 2026 знову наголошує на важливості фотонних і кремнієвих оптичних технологій.

Коли обчислювальна потужність переходить до системного рівня, оптика стає не просто технологією, а індустріальною основою.

З цієї точки зору, CPO і оптоволоконні системи мають велике майбутнє!

Закінчуючи: головний напрямок розвитку AGI

Автор постійно виступає за об’єктивні, вимірювані стандарти обчислювальної потужності і використовує Tokens/W для тестування різних чіпів.

Якщо поглянути на історію технологій, коли внутрішній двигун з високим співвідношенням вихідної енергії до ваги з’явився, з’явилися автомобілі, літаки і ракети.

У епоху AI, коли співвідношення результатів (Token) до спожитої енергії зростає, інтелект стає все розумнішим, і з’являється можливість створити AGI.

Найважливіше на GTC 2026 — це не слава NVIDIA або статус 黃仁勳 як «короля токенів», а нові стандарти вимірювання.

Ще важливіше — багато гігантів індустрії вже усвідомлюють, що потрібно дивитись на розвиток AI з системної перспективи.

Це — відповідь людській цивілізації: використовувати менше енергії для збору, передачі і обробки більшої кількості інформації.

І AGI — не виняток!

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити