Сьогоднішня найважливіша подія — конференція NVIDIA GTC, це фактично історія людства у форматі штучного інтелекту.

robot
Генерація анотацій у процесі

Сьогодні найважливіше — конференція GTC від Nvidia, просто AI-версія «Історії людства в хронології».

Джинь Чженюй ще навіть не вийшов на сцену, а витік інформації наперед уже можна розписати на цілу книгу.

Вечір-рано зібрав(ла) три головні моменти, давай, друзі, ходімо зі мною.

1)Вартість AI-обчислень напряму скорочується до однієї десятої

Після попереднього Blackwell, який уже був дуже потужним, правда? Невдовзі оголосять масове виробництво новітнього чипа Vera Rubin.

У чому «жар» Vera Rubin? Якщо сказати просто — дві речі: дешевше.

Запускаєш той самий AI-модель, кількість чипів скорочується до чверті, а витрати на обчислення для виведення падають на дев’яносто відсотків. Падають на дев’яносто відсотків, друзі. AWS, Microsoft, Google — три головні хмарні провайдери — одразу беруться на борт у першій хвилі.

2)Торік вони витратили 20 мільярдів доларів на Groq — сьогодні здають роботу

Раніше Дженсън Ху на зустрічі з інвесторами казав, що Groq буде підключатися до екосистеми Nvidia як розширювана архітектура — як тоді, коли придбали Mellanox, щоб доповнити мережеві можливості.

LPU Groq і GPU Nvidia стоять в одному й тому самому дата-центрі: GPU розуміє задачу, а LPU швидко видає відповідь.

Коли ці два чипи працюють у розподілі ролей, затримка в сценаріях Agent знижується просто «в нуль».

AI Agent виконує роботу замість людини: один і той самий задачний цикл може влаштувати десятки раундів налаштування моделі, і кожен раунд — це спалювання обчислювальної потужності для інференсу, а користувач тим часом чекає — якщо трохи повільніше, то враження валиться.

Інференс проходить у два кроки: спочатку зрозуміти твоє питання, а потім слово за словом «вивергнути» відповідь.

GPU чудово справляється з першим кроком, але швидкість і стабільність «видачі тексту» у другому — сильніші в Groq LPU.

20 мільярдів — це дорого? Подумай: у майбутньому кожна компанія ганятиме по кілька сотень Agentів, а кожен Agent щодня налаштовуватиме модель по кілька тисяч разів.

3)Запускається OpenClaw від Nvidia — його назвали NemoClaw

Це набір open-source платформи: компанії встановлюють — і можуть розгортати AI-працівників, які замість людей виконують процеси, обробляють дані та керують проєктами. Кажуть, що вже ведуть переговори з Salesforce та Adobe.

Цікаво ж те, що NemoClaw не вимагає від тебе використовувати чипи Nvidia. Подивіться на цю логіку — оціни цей хід думок. Продаж чипів приносить гроші лише за «залізний» шар; щоб заробляти на всьому ланцюжку, треба задавати правила. Дженсєн Ху цей підрахунок зробив дуже добре.

4)Дженсєн Ху каже, що покаже «чип, якого світ ще не бачив»

Ймовірно, це вперше покажуть Feynman — першу появу архітектури наступного за наступним поколінням, масове виробництво у 2028 році, найсучасніший процес TSMC 1.6nm.

Крім того, є ще один «свіжий» і, як на мене, цікавий шматок.

Nvidia випустила процесори для ноутбуків — дві моделі, з акцентом на ігри. Тим, хто продає відеокарти, доведеться йти відбирати ринок CPU — їхній «хліб».

Вечір-рано, я відчуваю: у майбутньому Дженсєн Ху стане легендарною постаттю, одним із великих.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити