Сегодняшнее самое важное событие — конференция NVIDIA GTC, это практически версия AI-истории человечества.

robot
Генерация тезисов в процессе

Сегодня самое важное событие — конференция NVIDIA GTC, практически версия AI-версии «Краткой истории человечества».

Хуанг Ренсюнь еще не вышел на сцену, а уже утечек столько, что хватило бы на книгу.

Вечером я подготовил три главных пункта, давайте, друзья, идем со мной.

  1. Стоимость вычислений для ИИ снизилась вдвое

Предыдущее поколение Blackwell уже было очень мощным, верно? Скоро будет объявлено о серийном производстве нового чипа Vera Rubin.

Чем хорош Vera Rubin? Говоря прямо, двумя словами: дешевый.

Для одинаковой модели ИИ, количество чипов сокращено до четверти, стоимость вычислений для вывода снизилась на 90%. Снизилась на девяносто процентов, друзья. AWS, Microsoft, Google — три крупнейших облачных провайдера — сразу первыми начали использовать.

  1. Groq, купленная за 20 миллиардов долларов в прошлом году, сегодня сдает работу

Ранее Хуанг Ренсюнь на отчете по результатам говорил, что Groq будет интегрирована в архитектуру NVIDIA, как когда-то Mellanox дополнила сетевые возможности.

LPU Groq и GPU NVIDIA работают в одном дата-центре: GPU занимается пониманием задач, LPU отвечает за быстрое выдачу ответов.

Два типа чипов работают вместе, задержка в сценариях AI-агентов снижается прямо пропорционально.

AI-агент выполняет работу за человека, один и тот же задачей может перезагружать модель десятки раз, каждый раз тратя вычислительные ресурсы для вывода, а пользователь ждет, и если медленно — опыт страдает.

Вывод идет в два этапа: сначала понимание вопроса, потом — по буквам выдача ответа.

GPU хорошо справляется с первым этапом, но скорость и стабильность вывода по буквам — сильнее у LPU Groq.

200 миллиардов — дорого?

Подумайте, что в будущем каждая компания будет запускать сотни агентов, каждый день — тысячи запросов к моделям.

  1. Запуск NVIDIA-версии OpenClaw — NemoClaw

Это открытая платформа, которая позволяет компаниям развертывать AI-работников для автоматизации процессов, обработки данных, управления проектами. Говорят, уже ведутся переговоры с Salesforce и Adobe.

Интересная особенность — NemoClaw не требует использования чипов NVIDIA. Посмотрите на этот логик. Продавать только чипы — это зарабатывание только на аппаратной части, а устанавливать правила — значит зарабатывать на всей цепочке. Хуанг Ренсюнь прекрасно это понимает.

  1. Хуанг Ренсюнь заявил, что покажет «чипы, которых мир никогда не видел»

Вероятно, речь идет о следующем поколении архитектуры Feynman, впервые появится в 2028 году, с использованием самой передовой технологии TSMC — 1.6 нм.

Еще есть одна малоизвестная новость, которая кажется мне очень интересной.

NVIDIA выпустила ноутбучные процессоры, две модели, ориентированные на игры. Продавцы видеокарт начинают конкурировать за рынок CPU.

Вечером я чувствую, что Хуанг Ренсюнь в будущем станет великим человеком.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить