Найважливіша подія сьогодні — конференція GTC від Nvidia, це просто AI-версія короткої історії людства.

robot
Генерація анотацій у процесі

Сьогодні найважливіша подія — конференція GTC від NVIDIA, це справжня «Коротка історія людства» в стилі ШІ.

Джен-Сюнь Хуан ще не вийшов на сцену, а обсяг витоку інформації вже вистачив би на цілу книгу.

Ваньвань підготувала три головні моменти. Давайте, друзі, рушаймо за мною.

  1. Вартість обчислювальних потужностей ШІ знизиться вдесятеро

Попереднє покоління Blackwell вже було потужним, чи не так? Незабаром оголосять про масове виробництво нового чипа Vera Rubin.

У чому сила Vera Rubin? Простіше кажучи, одне слово: дешево.

Запуск тієї ж моделі ШІ, кількість чипів скорочується до чверті, а вартість інференційних обчислень падає на 90%. На 90%, друзі. AWS, Microsoft і Google — три головні хмарні провайдери — одразу першими сідають на борт.

  1. Groq, придбаний минулого року за $20 млрд, сьогодні звітує

Раніше Джен-Сюнь Хуан на звіті про результати сказав, що Groq буде інтегровано в архітектуру NVIDIA як розширення, подібно до того, як колись придбання Mellanox доповнило мережеві можливості.

LPU від Groq і GPU від NVIDIA розміщені в одному дата-центрі: GPU розуміють питання, а LPU відповідають за швидке видавання відповідей.

Два типи чипів працюють разом, що безпосередньо знижує затримку в сценаріях Agent.

AI Agent виконує роботу за людину: одне завдання може вимагати десятків ітерацій виклику моделі, кожна з яких спалює інференційні обчислення, до того ж користувач чекає — якщо повільно, досвід руйнується.

Інференція складається з двох кроків: спочатку зрозуміти ваше питання, потім слово за словом видати відповідь.

GPU сильні в першому кроці, але в швидкості та стабільності видавання слів на другому кроці LPU від Groq сильніші.

Чи дорого це коштує $20 млрд?

Подумайте: у майбутньому кожна компанія запускатиме сотні Agentів, кожен Agent тисячі разів на день викликатиме модель.

  1. Версія OpenClaw від NVIDIA вийшла, називається NemoClaw

Це відкрита платформа: підприємства можуть встановити її та розгорнути AI-співробітників, які виконуватимуть процеси, оброблятимуть дані та керуватимуть проектами замість людей. Кажуть, вже ведуть переговори з Salesforce і Adobe.

Цікаво те, що NemoClaw не вимагає використання чипів NVIDIA. Ви самі оцініть цю логіку. Продаючи чипи, заробляють лише на рівні апаратного забезпечення, а встановлюючи правила, можна заробляти на всьому ланцюжку. Джен-Сюнь Хуан чітко прорахував цю бухгалтерію.

  1. Джен-Сюнь Хуан сказав, що покаже «чип, якого світ ще не бачив»

Швидше за все, це перша поява архітектури наступного покоління Feynman, яка вийде у масове виробництво в 2028 році за найпередовішим 1,6-нм техпроцесом TSMC.

Крім того, є ще одна цікава маловідома деталь.

NVIDIA випускає процесори для ноутбуків, дві моделі, орієнтовані на ігри. Продавці відеокарт збираються відібрати хліб у CPU.

Ваньвань відчуває, що Джен-Сюнь Хуан у майбутньому стане великою людиною епохи.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено