Сьогоднішня найважливіша подія — конференція NVIDIA GTC, це фактично історія людства у версії штучного інтелекту.

robot
Генерація анотацій у процесі

Найважливіша подія сьогодні — конференція NVIDIA GTC, фактично версія людської історії штучного інтелекту.

Ще не вийшов на сцену Дженсен Хуанг, а вже витік інформації настільки великий, що його можна написати цілу книгу.

Вечірній огляд трьох головних моментів, давайте, друзі, йдемо зі мною.

  1. Вартість обчислень для ШІ зменшена вдвічі

Попереднє покоління Blackwell вже було дуже потужним, так? Скоро буде оголошено про масове виробництво нового чипа Vera Rubin.

Чим же особливий Vera Rubin? Простими словами — двома словами: дешевий.

Для однакової моделі ШІ, кількість чипів скорочується до чверті, а вартість обчислень для виведення зменшується на 90%. Зменшення на дев’яносто відсотків, друзі. AWS, Microsoft, Google — три великі хмарні провайдери — одразу перші, хто підключаться.

  1. Вчора за 20 мільярдів доларів купили Groq, сьогодні здають роботу

Раніше Дженсен Хуанг на звіті говорив, що Groq стане частиною розширеної архітектури NVIDIA, так само, як колись придбання Mellanox доповнило мережеві можливості.

LPU від Groq і GPU від NVIDIA розміщені в одному дата-центрі, GPU розуміє проблему, а LPU відповідає швидкому виведенню відповіді.

Спільна робота двох типів чипів зменшує затримки у сценаріях агентів.

Штучний агент виконує роботу за людину, один і той самий завдання може вимагати десятки раундів налаштування моделі, кожен з яких спалює обчислювальні ресурси для виведення, а користувач чекає, і якщо затримка буде більшою — досвід руйнується.

Обчислення для виведення складається з двох кроків: спочатку зрозуміти ваше питання, потім по одному слову видавати відповідь.

GPU добре справляється з першим кроком, але швидкість і стабільність другого — сильна сторона LPU від Groq.

200 мільярдів — це дорого?

Уявіть, що кожна компанія матиме сотні агентів, кожен день налаштовуючи тисячі моделей.

  1. Вийшов NVIDIA-версія OpenClaw, називається NemoClaw

Це відкритий платформний комплекс, який дозволяє компаніям запускати AI-співробітників для автоматизації процесів, обробки даних і управління проектами. Кажуть, вже ведуть переговори з Salesforce і Adobe.

Цікаво те, що NemoClaw не вимагає використання чипів NVIDIA. Подумайте, яка тут логіка. Продаж чипів приносить лише прибуток з апаратного забезпечення, але встановлення правил дозволяє заробляти на всій ланцюжку. Дженсен Хуанг чітко розрахував цю схему.

  1. Дженсен Хуанг заявив, що представить «чипи, яких світ ще не бачив»

Майже напевно, це буде перша поява архітектури наступного покоління Feynman, яка вийде на масове виробництво у 2028 році на найсучаснішому процесі TSMC — 1.6 нм.

Ще є одна маловідома новина, яка мені здається досить цікавою.

NVIDIA випустила ноутбучні процесори, дві моделі, орієнтовані на ігри. Тепер виробники відеокарт змагатимуться за частку ринку процесорів.

Вечірній огляд — здається, Дженсен Хуанг стане великим героєм майбутнього.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити