От инфраструктуры ИИ, чиповых платформ, корпоративного ИИ до Боты и цифровых двойников... Лао Хуан описал восходящую эру фабрики ИИ (AI Factory).
Автор: Чжан Яцци
Источник: Уолл-стрит Джорнел
19 мая 2025 года основатель и CEO NVIDIA Хуан Жэньсюнь на конференции Computex 2025 произнес двухчасовую важную ключевую речь.
От инфраструктуры ИИ, чиповых платформ, корпоративного ИИ до Ботов и цифровых двойников... Лао Хуан описал новую эру ИИ фабрик (AI Factory), которая восходит.
В прошлом дата-центры служили традиционным приложениям; а сегодня AI дата-центры — это не просто «дата-центры», а AI фабрики (AI Factory): новый тип умной фабрики, где электроэнергия является входом, а «Token» — выходом.
«NVIDIA больше не просто технологическая компания, теперь мы компания по разработке инфраструктуры ИИ.»
Он подчеркивает, что это третья революция в области инфраструктуры после электричества и интернета — умственная инфраструктура.
Важный релиз чипов: Grace Blackwell GB200 и архитектура NVLink
Хуан Жэньсюн продемонстрировал NVLink Spine — это основной модуль связи весом 70 фунтов, с двухмильным кабелем и пропускной способностью 130 ТБ/с. Он заявил: «Пропускная способность этой системы больше, чем у всего Интернета!»
GB200 Grace Blackwell суперчип использует двойную упаковку чипов и соединяет 72 GPU, больше похожий на «виртуальный гигантский чип». Он построен на новейшей архитектуре NVLink Spine, эквивалентной производительности суперкомпьютера Sierra 2018 года на одном узле.
!
Хуан Жэньсюн сказал:
«Это не сервер, это фабрика ИИ. Вы вводите в нее энергию, и она дает вам токены.»
Кроме того, на этой пресс-конференции была представлена система обновления GB200. NVIDIA планирует выпустить GB300 в третьем квартале, этот чип обеспечит улучшение производительности вывода на 1,5 раза, увеличение памяти HBM в 1,5 раза, увеличение сетевой пропускной способности в 2 раза и сохранит физическую совместимость с предыдущим поколением, обеспечивая 100% жидкостное охлаждение.
Наиболее примечательным является план NVLink Fusion.
Архитектура NVLink Fusion может бесшовно соединять CPU / ASIC / TPU от других производителей с GPU от NVIDIA. Эта технология предоставляет IP-адрес NVLink Chiplet и интерфейса, позволяя свободно комбинировать «полуиндивидуальную инфраструктуру».
Простыми словами, клиенты могут выбрать использование своего процессора вместе с AI-чипами NVIDIA или использование процессора NVIDIA с AI-ускорителями других поставщиков.
Существует мнение, что NVLink, будучи одной из ключевых технологий NVIDIA для обеспечения доминирования в области AI-нагрузок, решает проблему скорости связи между GPU и CPU в AI-серверах, что является одним из крупнейших препятствий для масштабируемости и напрямую влияет на пиковую производительность и энергоэффективность. По сравнению со стандартным интерфейсом PCIe, он предлагает более высокую пропускную способность и более низкую задержку, причем преимущество по пропускной способности достигает 14 раз.
NVLink Fusion позволяет Fujitsu и Qualcomm использовать этот интерфейс для своих собственных CPU, функции NVLink интегрированы в чипсет рядом с вычислительной упаковкой. NVIDIA также привлекла кастомные кремниевые акселераторы от таких дизайнеров, как MediaTek, Marvell и Alchip, поддерживающие другие типы пользовательских AI акселераторов для совместной работы с CPU Grace от NVIDIA.
Хуан Рэнсюнь с юмором сказал:
«Конечно, если ты полностью используешь лучшее от Nvidia, это сделает меня самым счастливым. Но если ты используешь только немного от Nvidia, я тоже буду очень рад.»
Эра персональных суперкомпьютеров: DGX Spark и DGX Station
Хуан Жэньсюн заявил, что персональный ИИ-компьютер Project DIGITS DGX Spark, о котором он упоминал ранее на CES, уже полностью запущен в производство и поступит в продажу в ближайшие несколько недель.
DGX Spark предназначен для исследователей ИИ, которые хотят иметь свои собственные суперкомпьютеры, компании будут устанавливать свои собственные цены. Хуан Жэньсюн заявил: «Каждый сможет иметь такой к Рождеству.»
«Сегодня каждый может иметь свой собственный ИИ суперкомпьютер, и... его можно подключить к кухонной розетке.»
!
Корпоративный ИИ: от аппаратного обеспечения до агентного ИИ
Хуан Жэньсюн также представил серверы AI RTX Pro для бизнеса: поддерживает традиционные нагрузки IT на x86, Hypervisor, Windows и т.д. Также может запускать графические AI агенты (AI Agents), и даже играть в Crysis.
Хуан Жэньсюн заявил, что Agentic AI — это «цифровой сотрудник» будущего. Цифровые службы поддержки, цифровые маркетинговые менеджеры, цифровые инженеры и т.д. станут частью рабочей силы компаний. NVIDIA развернет полный стек AI Ops и будет сотрудничать с такими компаниями, как CrowdStrike, Red Hat, DataRobot для продвижения внедрения AI в бизнес.
«Нам понадобятся новые HR для управления этими AI сотрудниками.»
!
Совершенно новая архитектура хранения AI: NVIDIA AIQ + Nemo + GPU хранилище на фронте
Хуан Жэньсюн заявил, что ИИ больше не просто читает SQL, ему необходимо понимать семантику неструктурированных данных, будущие системы хранения будут встроены с GPU для поиска, сортировки, встраивания и индексирования.
NVIDIA также развернет Nemo + NeMo Retriever + IQ, открытый «AI семантический поисковый фреймворк», и будет сотрудничать с Dell, Hitachi, IBM, NetApp, VAST для развертывания корпоративной платформы.
Боты станут следующей «триллионной индустрией»
Хуан Жэньсюн заявил, что они параллельно развивают системы Ботов в автомобильной промышленности, используя платформу Isaac Groot, которая управляется новым процессором под названием Jetson Thor, специально разработанным для приложений Ботов, подходящим для автономных транспортных средств и человеко-машинных систем. Операционная система Isaac от NVIDIA управляет всей обработкой нейронных сетей, обработкой сенсоров и потоками данных, используя предобученные модели, разработанные специализированной командой Ботов для повышения возможностей системы.
«В эпоху ИИ, чтобы обучить Боты... сначала нужно использовать ИИ, чтобы обучить ИИ.»
!
Хуан Жэньсюн также заявил, что они применяют свою модель ИИ в автономных автомобилях, совместно с Mercedes запускают глобальный автопарк, который будет использовать технологию автономного вождения от NVIDIA и сможет быть реализован уже в этом году.
Он считает, что Боты станут следующей отраслью стоимостью в триллионы долларов, но для этого потребуется много усилий. Отдел Ботов компании NVIDIA способен на это, и это связано исключительно с масштабируемостью.
Запуск физического AI двигателя Newton
Хуан Жэньсюнь заявил, что уже сотрудничает с DeepMind и Disney Research для разработки самого современного в мире физического движка Newton, который планируется открыть в июле.
Согласно информации, Newton полностью поддерживает GPU-ускорение, обладает высокой дифференцируемостью и сверхреальным оперативным потенциалом, что позволяет эффективно обучаться через опыт. NVIDIA интегрирует этот физический движок в симулятор ISAAC от NVIDIA, что позволяет нам «оживить» этих Боты реальным образом.
Посмотреть Оригинал
Содержание носит исключительно справочный характер и не является предложением или офертой. Консультации по инвестициям, налогообложению или юридическим вопросам не предоставляются. Более подробную информацию о рисках см. в разделе «Дисклеймер».
Одним предложением о выступлении Лао Хуаня на ComputeX: это не запуск продукта, это «Мобилизация промышленной революции ИИ».
Автор: Чжан Яцци
Источник: Уолл-стрит Джорнел
19 мая 2025 года основатель и CEO NVIDIA Хуан Жэньсюнь на конференции Computex 2025 произнес двухчасовую важную ключевую речь.
От инфраструктуры ИИ, чиповых платформ, корпоративного ИИ до Ботов и цифровых двойников... Лао Хуан описал новую эру ИИ фабрик (AI Factory), которая восходит.
В прошлом дата-центры служили традиционным приложениям; а сегодня AI дата-центры — это не просто «дата-центры», а AI фабрики (AI Factory): новый тип умной фабрики, где электроэнергия является входом, а «Token» — выходом.
«NVIDIA больше не просто технологическая компания, теперь мы компания по разработке инфраструктуры ИИ.»
Он подчеркивает, что это третья революция в области инфраструктуры после электричества и интернета — умственная инфраструктура.
Важный релиз чипов: Grace Blackwell GB200 и архитектура NVLink
Хуан Жэньсюн продемонстрировал NVLink Spine — это основной модуль связи весом 70 фунтов, с двухмильным кабелем и пропускной способностью 130 ТБ/с. Он заявил: «Пропускная способность этой системы больше, чем у всего Интернета!»
GB200 Grace Blackwell суперчип использует двойную упаковку чипов и соединяет 72 GPU, больше похожий на «виртуальный гигантский чип». Он построен на новейшей архитектуре NVLink Spine, эквивалентной производительности суперкомпьютера Sierra 2018 года на одном узле.
!
Хуан Жэньсюн сказал:
«Это не сервер, это фабрика ИИ. Вы вводите в нее энергию, и она дает вам токены.»
Кроме того, на этой пресс-конференции была представлена система обновления GB200. NVIDIA планирует выпустить GB300 в третьем квартале, этот чип обеспечит улучшение производительности вывода на 1,5 раза, увеличение памяти HBM в 1,5 раза, увеличение сетевой пропускной способности в 2 раза и сохранит физическую совместимость с предыдущим поколением, обеспечивая 100% жидкостное охлаждение.
!
NVLink Fusion:открытая экосистема взаимосвязанности чипов
Наиболее примечательным является план NVLink Fusion.
Архитектура NVLink Fusion может бесшовно соединять CPU / ASIC / TPU от других производителей с GPU от NVIDIA. Эта технология предоставляет IP-адрес NVLink Chiplet и интерфейса, позволяя свободно комбинировать «полуиндивидуальную инфраструктуру».
Простыми словами, клиенты могут выбрать использование своего процессора вместе с AI-чипами NVIDIA или использование процессора NVIDIA с AI-ускорителями других поставщиков.
Существует мнение, что NVLink, будучи одной из ключевых технологий NVIDIA для обеспечения доминирования в области AI-нагрузок, решает проблему скорости связи между GPU и CPU в AI-серверах, что является одним из крупнейших препятствий для масштабируемости и напрямую влияет на пиковую производительность и энергоэффективность. По сравнению со стандартным интерфейсом PCIe, он предлагает более высокую пропускную способность и более низкую задержку, причем преимущество по пропускной способности достигает 14 раз.
NVLink Fusion позволяет Fujitsu и Qualcomm использовать этот интерфейс для своих собственных CPU, функции NVLink интегрированы в чипсет рядом с вычислительной упаковкой. NVIDIA также привлекла кастомные кремниевые акселераторы от таких дизайнеров, как MediaTek, Marvell и Alchip, поддерживающие другие типы пользовательских AI акселераторов для совместной работы с CPU Grace от NVIDIA.
Хуан Рэнсюнь с юмором сказал:
«Конечно, если ты полностью используешь лучшее от Nvidia, это сделает меня самым счастливым. Но если ты используешь только немного от Nvidia, я тоже буду очень рад.»
Эра персональных суперкомпьютеров: DGX Spark и DGX Station
Хуан Жэньсюн заявил, что персональный ИИ-компьютер Project DIGITS DGX Spark, о котором он упоминал ранее на CES, уже полностью запущен в производство и поступит в продажу в ближайшие несколько недель.
DGX Spark предназначен для исследователей ИИ, которые хотят иметь свои собственные суперкомпьютеры, компании будут устанавливать свои собственные цены. Хуан Жэньсюн заявил: «Каждый сможет иметь такой к Рождеству.»
«Сегодня каждый может иметь свой собственный ИИ суперкомпьютер, и... его можно подключить к кухонной розетке.»
!
Корпоративный ИИ: от аппаратного обеспечения до агентного ИИ
Хуан Жэньсюн также представил серверы AI RTX Pro для бизнеса: поддерживает традиционные нагрузки IT на x86, Hypervisor, Windows и т.д. Также может запускать графические AI агенты (AI Agents), и даже играть в Crysis.
Хуан Жэньсюн заявил, что Agentic AI — это «цифровой сотрудник» будущего. Цифровые службы поддержки, цифровые маркетинговые менеджеры, цифровые инженеры и т.д. станут частью рабочей силы компаний. NVIDIA развернет полный стек AI Ops и будет сотрудничать с такими компаниями, как CrowdStrike, Red Hat, DataRobot для продвижения внедрения AI в бизнес.
«Нам понадобятся новые HR для управления этими AI сотрудниками.»
!
Совершенно новая архитектура хранения AI: NVIDIA AIQ + Nemo + GPU хранилище на фронте
Хуан Жэньсюн заявил, что ИИ больше не просто читает SQL, ему необходимо понимать семантику неструктурированных данных, будущие системы хранения будут встроены с GPU для поиска, сортировки, встраивания и индексирования.
NVIDIA также развернет Nemo + NeMo Retriever + IQ, открытый «AI семантический поисковый фреймворк», и будет сотрудничать с Dell, Hitachi, IBM, NetApp, VAST для развертывания корпоративной платформы.
Боты станут следующей «триллионной индустрией»
Хуан Жэньсюн заявил, что они параллельно развивают системы Ботов в автомобильной промышленности, используя платформу Isaac Groot, которая управляется новым процессором под названием Jetson Thor, специально разработанным для приложений Ботов, подходящим для автономных транспортных средств и человеко-машинных систем. Операционная система Isaac от NVIDIA управляет всей обработкой нейронных сетей, обработкой сенсоров и потоками данных, используя предобученные модели, разработанные специализированной командой Ботов для повышения возможностей системы.
«В эпоху ИИ, чтобы обучить Боты... сначала нужно использовать ИИ, чтобы обучить ИИ.»
!
Хуан Жэньсюн также заявил, что они применяют свою модель ИИ в автономных автомобилях, совместно с Mercedes запускают глобальный автопарк, который будет использовать технологию автономного вождения от NVIDIA и сможет быть реализован уже в этом году.
Он считает, что Боты станут следующей отраслью стоимостью в триллионы долларов, но для этого потребуется много усилий. Отдел Ботов компании NVIDIA способен на это, и это связано исключительно с масштабируемостью.
Запуск физического AI двигателя Newton
Хуан Жэньсюнь заявил, что уже сотрудничает с DeepMind и Disney Research для разработки самого современного в мире физического движка Newton, который планируется открыть в июле.
Согласно информации, Newton полностью поддерживает GPU-ускорение, обладает высокой дифференцируемостью и сверхреальным оперативным потенциалом, что позволяет эффективно обучаться через опыт. NVIDIA интегрирует этот физический движок в симулятор ISAAC от NVIDIA, что позволяет нам «оживить» этих Боты реальным образом.