Сегодня самое важное событие — конференция NVIDIA GTC, практически версия AI-истории человечества.

robot
Генерация тезисов в процессе

Самое важное сегодня — конференция GTC от NVIDIA, это вообще «всемирная история человечества» в версии про ИИ.

Дженсен Ху (Жэнь-ин Сюнь) еще не вышел на сцену, а утечка информации уже тянет на целую книгу.

Ван-Ван собрала три главных момента. Поехали, ребята, идем со мной.

1)Стоимость ИИ-вычислений напрямую снизилась до одной десятой

Предыдущее поколение Blackwell и так было очень мощным, верно? Скоро объявят о массовом производстве нового поколения чипов Vera Rubin.

В чем сила Vera Rubin? Если по-простому — всего два слова: дешево.

Запускаешь те же самые ИИ-модели —
количество чипов сокращается до четверти, а стоимость инференса падает на 90%.
Снижение на 90%, друзья.
AWS, Microsoft и Google — три крупнейших облачных провайдера — напрямую заходят в первую партию.

2)Groq, которую в прошлом году купили за 20 миллиардов долларов, сегодня сдает домашнее задание

Раньше Ху на встрече с инвесторами говорил, что Groq будет подключаться к экосистеме NVIDIA как расширяемая архитектура — примерно как тогда, когда купили Mellanox, чтобы добить сетевые возможности.

LPU Groq и GPU от NVIDIA находятся в одном дата-центре:
GPU понимает задачу, а LPU быстро выдает ответ.

Когда эти два типа чипов работают вместе, задержка в сценариях с Agent падает напрямую.

AI Agent делает работу за человека: один и тот же таск может туда-сюда дергать модель десятки раз, на каждой итерации сжигаются вычисления на инференс, а пользователь при этом ждет — если будет медленно, впечатление просто рухнет.

Инференс идет в два шага: сначала понять ваш вопрос, а затем буквально слово за словом «выдать» ответ.

GPU отлично справляется с первым шагом, но по скорости и стабильности «выдачи» текста на втором шаге сильнее Groq — его LPU.

20 миллиардов — это дорого?

Представьте: в будущем каждая компания будет запускать сотни Agent, а каждый Agent каждый день будет дергать модель тысячи раз.

3)Запущен OpenClaw от NVIDIA, называется NemoClaw

Это набор open-source платформ, чтобы компании могли поставить и развернуть ИИ-сотрудника, который вместо живого человека ведет процессы, обрабатывает данные и ведет проекты.
Говорят, уже ведут переговоры с Salesforce и Adobe.

Самое интересное в том, что NemoClaw не требует, чтобы вы использовали чипы NVIDIA.
Оцените логику, да?
Продажа чипов приносит прибыль только на одном слое — на железе. А чтобы зарабатывать на всей цепочке, нужно задавать правила. Ху наверняка эти расчеты уже сделал до мелочей.

4)Ху говорит, что покажет «чип, который мир еще не видел»

С высокой вероятностью это впервые появится Feynman — архитектура следующего поколения, массовое производство в 2028 году, процесс TSMC по самому передовому техпроцессу 1.6nm.

Еще есть один неожиданный, но интересный момент.

NVIDIA выпустила процессоры для ноутбуков — две версии, с упором на игры.
Продавцам видеокарт придется прийти и отвоевывать свою еду у CPU.

По ощущениям, Ван-Ван, в будущем Ху станет легендарным великим человеком.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить