Сегодня самое важное событие — конференция NVIDIA GTC, практически версия AI-истории человечества.

robot
Генерация тезисов в процессе

Сегодня самое важное — конференция GTC от NVIDIA, это просто «человеческая история» в версии про ИИ.

Дженсен Ху еще даже не вышел на сцену, а утечка информации заранее уже тянет на целую книгу.

Ван Ван собрала три главных акцента. Давайте, ребята, идем со мной.

1)Стоимость ИИ-вычислений напрямую уменьшится вдвое

Предыдущее поколение Blackwell уже очень мощное, верно? Совсем скоро объявят о серийном производстве нового поколения чипов Vera Rubin.

Чем Vera Rubin так мощна? Если по-простому — всего две вещи: «дешевле».

Запускаете те же самые ИИ-модели: количество чипов сокращается до четверти, а стоимость вывода снижается на девяносто процентов. Снижается на девяносто процентов, друзья. AWS, Microsoft и Google — три крупнейших облачных провайдера — сразу же первыми начнут подключаться.

2)Groq, который в прошлом году купили за $20 млрд — сегодня сдаёт домашнее задание

Раньше на отчете о прибылях Дженсен Ху говорил, что Groq будет подключаться к экосистеме NVIDIA как расширяемая архитектура — примерно так же, как тогда купили Mellanox, чтобы закрыть пробелы в сетевых возможностях.

LPU от Groq и GPU от NVIDIA находятся в одном дата-центре: GPU понимает задачу, LPU быстро выдает ответ.

Когда эти два типа чипов работают в тандеме, задержка в сценариях с Agent падает прямо «в землю».

ИИ-агент делает работу вместо человека: один и тот же рабочий процесс может потребовать десятки циклов настройки модели, и на каждой итерации сжигается вычислительная мощность для вывода — при этом пользователь ждет, и если будет чуть медленнее, впечатление рушится.

Вывод делится на два шага: сначала понять ваш вопрос, а затем слово за словом «выдать» ответ.

GPU силен на первом этапе, но во втором — по скорости и стабильности проговаривания — LPU от Groq лучше.

$20 млрд — это дорого?

Подумайте сами: дальше каждая компания будет запускать по несколько сотен Agent, и каждый Agent будет настраивать модель по несколько тысяч раз в день.

3)Появилась OpenClaw от NVIDIA — называется NemoClaw

Это набор open-source-платформы: компании ставят ее — и можно развернуть ИИ-сотрудников, которые вместо людей выполняют процессы, обрабатывают данные, ведут проекты. Говорят, уже идут переговоры с Salesforce и Adobe.

Самое интересное в том, что NemoClaw не требует, чтобы вы использовали чипы NVIDIA. Поищите этот смысл в себе, попробуйте понять логику. Продавать чипы — значит зарабатывать только на железе, а чтобы зарабатывать на всей цепочке, нужно задавать правила. Дженсен Ху эту бухгалтерию знает как свои пять пальцев.

4)Дженсен Ху говорит, что покажет «чип, который мир еще никогда не видел»

С высокой вероятностью это будет первое публичное появление Feynman — архитектуры следующего поколения; массовое производство в 2028 году, а техпроцесс — самый передовой 1.6nm от TSMC.

И еще есть один «неочевидный» момент, который мне кажется довольно интересным.

NVIDIA выпускает процессоры для ноутбуков — две модели, с упором на игры. Продавцы видеокарт идут отбирать хлеб у CPU.

У меня ощущение, что в будущем Дженсен Ху станет одним из великих людей своего времени.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить