Сьогоднішня найважливіша подія — конференція NVIDIA GTC, яка є майже версією людської історії в епоху штучного інтелекту.

robot
Генерація анотацій у процесі

Найважливіша подія сьогодні — конференція NVIDIA GTC, фактично версія людської історії з AI.

Ще не вийшов на сцену, а вже витік інформації настільки багато, що вистачить на книгу.

Вечірній підсумок трьох головних моментів, давайте, друзі, йдемо зі мною.

1)Вартість обчислень для AI знизилася вдвічі

Попереднє покоління Blackwell вже було дуже потужним, так? Скоро буде оголошено про масове виробництво нового чипа Vera Rubin.

Чим же особливий Vera Rubin? Говорячи просто, двома словами: дешевий.

Для однакової AI-моделі, кількість чипів скорочується до чверті, а вартість обчислень для виведення зменшується на 90%. Зменшення на дев’яносто відсотків, друзі. Три гіганти хмарних сервісів — AWS, Microsoft, Google — одразу перші, хто підключилися.

2)Groq, куплений минулого року за 20 мільярдів доларів, сьогодні здає роботу

Раніше на фінансовій конференції Хуанг сказав, що Groq стане розширювальною архітектурою, інтегрованою у систему NVIDIA, як колись Mellanox доповнив мережеві можливості.

LPU Groq і GPU NVIDIA розміщені в одному дата-центрі, GPU розуміє проблему, а LPU відповідає швидкому виведенню відповіді.

Спільна робота двох типів чипів зменшує затримки у сценаріях агентів.

AI-агенти виконують роботу за людей, один і той самий завдання може вимагати десятки раундів налаштування моделі, кожен з яких спалює обчислювальні ресурси для виведення, а користувачі чекають, і якщо затримка буде більшою — досвід руйнується.

Обчислення для виведення складаються з двох кроків: спочатку зрозуміти ваше питання, потім по одному слову видавати відповідь.

GPU добре справляється з першим кроком, але швидкість і стабільність другого кроку — сильна сторона LPU Groq.

200 мільярдів — дорого?

Уявіть, що кожна компанія в майбутньому матиме сотні агентів, кожен день налаштовуючи тисячі моделей.

3)Запуск NVIDIA-версії OpenClaw під назвою NemoClaw

Це відкритий платформний комплекс, який дозволяє компаніям запускати AI-посадовців для автоматизації процесів, обробки даних і управління проектами. Кажуть, вже ведуть переговори з Salesforce і Adobe.

Цікаво те, що NemoClaw не вимагає використання чипів NVIDIA. Подумайте про цю логіку. Продаж чипів приносить лише прибуток з апаратного забезпечення, але встановлення правил дозволяє заробляти на всій ланцюжку. Хуанг чітко розрахував цю стратегію.

4)Хуанг сказав, що представить «чипи, яких світ ще не бачив»

Майже напевно, це перша поява архітектури наступного покоління Feynman, яка буде запущена у 2028 році з найсучаснішою технологією TSMC 1.6 нм.

Ще є один маловідомий, але досить цікавий факт.

NVIDIA випустила ноутбучні процесори, дві моделі, орієнтовані на ігри. Тепер виробники відеокарт змагатимуться за частку ринку процесорів.

Вечірній підсумок — здається, Хуанг скоро стане великим героєм.

NVDAX0,81%
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено