黄仁勋 GTC 2026揭示「Token 经济学」:运算即营收,Nvidia全面量产启动Vera Rubin 、台湾 AI 需求火箭飙升

Рен Чжэньфэнь на GTC Taipei 2026 объявил о новой эпохе «Токен-экономики»: дата-центры AI переходят от продажи аппаратного обеспечения к модели «вычисления как доход», где каждый токен — это ценный актив, подлежащий ценообразованию и получению прибыли. Полностью масштабируемая архитектура Vera Rubin в сочетании с разъединенной инференцией на базе Groq LPU позволяет увеличить годовой доход дата-центров мощностью 1 ГВт с 30 миллиарда долларов до 300 миллиардов долларов. Рен Чжэньфэнь также объявил о запуске штаб-квартиры NVIDIA Constellation в Тайбэе, что свидетельствует о «ракетном» росте спроса на вычислительные ресурсы в Тайване.
(Предыстория: Рен Чжэньфэнь на GTC 2026 яростно говорит о «жесткости»? Почему LLM-агенты должны быть «жесткими», одна фраза раскрывает ключ к внедрению AI-агентов)
(Дополнительный фон: Мнение — смогут ли ChatGPT и Claude полностью вытеснить все виды работы?)

Содержание статьи

Переключить

  • Токен — это доход: бизнес-формула AI-фабрик
  • Vera Rubin — полностью в массовое производство: масштаб цепочки поставок вдвое больше
  • Разъединенная инференция: NVIDIA + Groq создают «двойной двигатель» токенов

Генеральный директор NVIDIA Рен Чжэньфэнь 1 июня на конференции GTC Taipei 2026 сделал важное заявление: «Токен — это актив, токен уже стал единицей дохода.» Он прямо заявил, что бизнес-логика индустрии AI меняется — от продажи GPU-аппаратуры к продаже «вычислительных результатов».

Это основное выступление в Тайбэе в Центре популярной музыки совпало с выставкой COMPUTEX 2026. Рен Чжэньфэнь не только вспомнил ключевые анонсы с GTC в Сан-Хосе, но и далее подтвердил на данных: масштаб AI-центра мощностью 1 ГВт, после перехода с Blackwell на Vera Rubin с разъединенной архитектурой инференции на базе Groq, может вырасти с примерно 30 миллиардов долларов до 300 миллиардов долларов — история «десятилетнего роста», которая взбудоражила всю цепочку поставок.

Токен — это доход: бизнес-формула AI-фабрик

Рен Чжэньфэнь систематически разобрал бизнес-логику «Токен-экономики» в своей речи. Он отметил, что инференс AI уже эволюционировал из «ответа на вопросы» в «генерацию прибыли» — каждый созданный токен может напрямую соответствовать платежеспособности конечного клиента. Для этого NVIDIA разработала пять моделей ценообразования токенов:

  • Бесплатный уровень: базовые вопросы и ответы, обслуживание клиентов
  • Легкий уровень (около 5 долларов за миллион токенов): генерация контента, резюме
  • Профессиональный уровень (около 30 долларов за миллион токенов): генерация кода, анализ данных
  • Корпоративный уровень (около 80 долларов за миллион токенов): нормативное соответствие, финансовое моделирование
  • Премиум уровень (около 150 долларов за миллион токенов): научные исследования, разработка лекарств, инференс в реальном времени

«Каждый токен может приносить прибыль, AI-компании захотят создавать больше токенов, генерировать их и производить больше AI-фабрик», — подчеркнул Рен Чжэньфэнь. Это и есть причина, почему в Тайване спрос на вычислительные ресурсы «ракетно растет» — когда вычисления напрямую связаны с доходами, расширение дата-центров становится неизбежным.

Vera Rubin — полностью в массовое производство: масштаб цепочки поставок вдвое больше

В качестве самого ожидаемого аппаратного анонса GTC 2026 архитектура Vera Rubin официально вышла на массовое производство. Рен Чжэньфэнь сообщил, что цепочка поставок Vera Rubin в два раза больше, чем у предшественника Grace Blackwell, и в ней участвуют более 150 тайваньских партнеров по всему миру.

Флагманский шкаф Vera Rubin NVL72 включает 72 GPU Rubin и 36 CPU Vera, использует 100% жидкостное охлаждение, что позволяет развернуть крупномасштабные модели AI в одном шкафу. Также впервые был опубликован дорожный план следующего поколения архитектуры Feynman, которая, как ожидается, еще больше повысит производительность инференса и энергоэффективность.

Стоит отметить, что в конце выступления Рен Чжэньфэнь намекнул, что во второй половине года появятся «сюрпризы» в виде новых продуктов, что вызвало повышенный интерес рынка к новым GPU для потребительского сегмента, автомобильным чипам и другим новинкам.

Разъединенная инференция: NVIDIA + Groq создают «двойной двигатель» токенов

Рен Чжэньфэнь особо отметил стратегию сотрудничества с компанией Groq, пионером в области LPU (языковой процессорной единицы). В отличие от GPU, которые хорошо справляются с массовыми параллельными вычислениями, чипы Groq 3 LPX, произведенные Samsung и планируемые к поставке в третьем квартале, ориентированы на сценарии с минимальной задержкой — в задачах инференса, требующих ответов за миллисекунды, производительность Groq LPU значительно превосходит традиционные GPU.

Рен Чжэньфэнь использовал простую формулу, чтобы объяснить бизнес-эффективность «разъединенной инференции»:

  • Blackwell поколение: годовой доход дата-центра 1 ГВт — около 30 миллиардов долларов
  • Vera Rubin поколение: при той же мощности — доход до 150 миллиардов долларов (в 5 раз больше)
  • Vera Rubin + разъединенная инференция на базе Groq: годовой доход достигает 300 миллиардов долларов (в 10 раз больше)

Дата-центры превращаются из мест обучения моделей в фабрики по производству токенов.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено