Сегодня самое важное событие — конференция NVIDIA GTC, практически версия AI-истории человечества.

robot
Генерация тезисов в процессе

Сегодня самое важное — конференция GTC от NVIDIA, прямо целая версия «истории человечества» в эпоху ИИ.

Дженсен Ху еще даже не вышел на сцену, а утекший заранее объем информации уже тянет на целую книгу.

Виви собрала три главных момента, поехали, ребята, идем со мной.

1)Расходы на ИИ-вычисления сразу бьют в десять раз

Предыдущее поколение Blackwell уже было очень мощным, верно? Совсем скоро объявят массовое производство следующего поколения чипов Vera Rubin.

Чем же силен Vera Rubin? Проще говоря, двумя словами: дешевле.

Запускаете ту же ИИ-модель —
количество чипов сокращается до четверти, а затраты на инференс понижаются на девяносто процентов.
Понижаются на девяносто процентов, друзья.
AWS, Microsoft и Google — три крупнейших облачных провайдера — сразу становятся в первую очередь на борт.

2)Groq, которые в прошлом году купили за 20 миллиардов долларов, сегодня сдает домашку

Раньше Дженсен Ху говорил на встрече по итогам: Groq будет подключаться к экосистеме NVIDIA в качестве расширяющей архитектуры — как тогда, когда покупкой Mellanox дополнили сетевые возможности.

LPU у Groq и GPU NVIDIA находятся в одном дата-центре: GPU понимает задачу, а LPU отвечает за быстрый вывод ответа.

Две категории чипов — с распределением ролей и совместной работой — снижают задержки в сценариях с Agent напрямую «в ноль».

ИИ Agent выполняет работу за человека: один и тот же таск может туда-сюда гонять десятки раундов настройки модели, и в каждом раунде выгорают вычисления для вывода, плюс пользователь все это время ждет — если будет медленнее, опыт просто рухнет.

Инференс делится на два шага: сначала вы понимаете вашу проблему, а затем слово за словом «выводите» ответ.

GPU силен в первом шаге, но скорость и стабильность «вывода слов» во втором — сильнее у LPU от Groq.

20 миллиардов — это дорого?

Подумайте сами: дальше каждая компания будет запускать сотни Agent, и каждый Agent будет настраивать модели по несколько тысяч раз в день.

3)Запускается OpenClaw от NVIDIA — он называется NemoClaw

Это целый набор с открытым исходным кодом: компания устанавливает его — и можно развернуть ИИ-сотрудников, которые заменяют людей в процессах, обрабатывают данные и ведут проекты.
Говорят, что уже ведут переговоры с Salesforce и Adobe.

Самое интересное тут в том, что NemoClaw не требует, чтобы вы использовали чипы NVIDIA.

Прочувствуйте этот ход мысли.
Продавать чипы — это зарабатывать только на одном «слое» железа; чтобы зарабатывать на всей цепочке, нужно задавать правила. Дженсен Ху эту арифметику, похоже, посчитал безошибочно.

4)Дженсен Ху говорит, что покажет «чип, которого мир еще не видел»

С большой вероятностью это будет впервые засветившаяся Feynman — архитектура следующего поколения, массовое производство в 2028 году, и техпроцесс TSMC самой передовой разработки 1,6 нм.

Еще есть один малообсуждаемый, но, как мне кажется, очень интересный момент.

NVIDIA выпустила процессоры для ноутбуков — две модели, с упором на игры.
Торговцам видеокартами придется идти забирать еду у тех, кто продает CPU.

Виви, у меня такое ощущение: в будущем Дженсен Ху станет великим человеком целой эпохи.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить