Сьогоднішня найважливіша подія — конференція NVIDIA GTC, це фактично історія людства у форматі штучного інтелекту.

robot
Генерація анотацій у процесі

Сьогодні найважливіша подія — конференція GTC від NVIDIA, прямо-таки AI-версія «історії людства».

Джєнсен Ху ще навіть не вийшов на сцену, а обсяг інформації, що вже просочився наперед, вистачає на цілу книжку.

Вечіркава зібрала три головні акценти, давайте, друзі, ходімо зі мною.

1)Вартість AI-обчислень прямо вдвічі менша

Потривоживши попереднє покоління Blackwell — воно ж уже дуже потужне, правда?
Невдовзі оголосять серійне виробництво нового покоління чипів Vera Rubin.

Чим же «жарить» Vera Rubin? Якщо по-простому — два слова: дешевше.

Запускаєте той самий AI-модельний ланцюжок:
кількість чипів скорочується до чверті, а витрати на інференс знижуються на 90%. Знижуються на 90%, друзі. AWS, Microsoft і Google — три найбільші хмарні провайдери — одразу заходять у першу хвилю.

2)Той Groq, який торік купили за 20 мільярдів доларів — сьогодні здає домашку

Раніше Джєнсен Ху на зустрічі з інвесторами казав, що Groq буде підключено до екосистеми NVIDIA як розширювальна архітектура — приблизно так само, як колись, коли купили Mellanox, щоб доповнити мережеві можливості.

LPU Groq і GPU NVIDIA працюють в одному й тому самому дата-центрі:
GPU розуміє запитання, а LPU швидко видає відповідь.

Розподіл ролей між двома типами чипів та їхня взаємодія — затримка в сценаріях Agent падає просто в рази.

AI Agent робить роботу замість людини: один і той самий задачний цикл може кілька десятків разів перемикати моделі, і кожна така ітерація спалює обчислювальні потужності для інференсу, а користувач у цей час чекає — трошки повільніше, і враження «ламається».

Інференс іде в два кроки: спочатку зрозуміти твоє питання, а потім — слово за словом «вивергнути» відповідь.

GPU сильний у першому кроці, але в швидкості та стабільності «промовляння» другого кроку Groq’s LPU значно потужніший.

20 мільярдів — це дорого?

Подумайте: у майбутньому кожна компанія запускатиме сотні Agent’ів, а кожен Agent щодня буде перемикати моделі по кілька тисяч разів.

3)NVIDIA-версія OpenClaw виходить у світ — вона ж NemoClaw

Це фактично набір відкритих інструментів: підприємства встановлюють — і можуть розгортати AI-працівників, щоб замість людей виконувати процеси, обробляти дані та вести проєкти. Кажуть, що вже перемовляються з Salesforce та Adobe.

Найцікавіше тут те, що NemoClaw не змушує тебе використовувати чипи NVIDIA. Ну як, що ви думаєте про цю логіку? Продавати чипи — заробляти лише на «залізному» шарі, а встановлювати правила — щоб заробляти на всьому ланцюжку. Джєнсен Ху порахував це дуже чітко.

4)Джєнсен Ху каже, що покаже «чип, якого світ ще ніколи не бачив»

Найімовірніше, це вперше покаже архітектуру наступного-до-наступного покоління Feynman: вона вперше з’явиться, а серійне виробництво — у 2028 році, за технологією TSMC з найсучаснішим 1.6nm процесом.

Є ще один «несподіваний» матеріал, який, на мою думку, дуже цікавий.

NVIDIA випустила процесори для ноутбуків — дві моделі, і вони орієнтовані на ігри. Тим, хто продає відеокарти, доведеться прийти встати, щоб забрати собі їжу CPU.

Вечіркава, мені здається, що в майбутньому Джєнсен Ху стане великим представником цілої епохи.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити