Сьогоднішня найважливіша подія — конференція NVIDIA GTC, це фактично історія людства у форматі штучного інтелекту.

robot
Генерація анотацій у процесі

Сьогодні найважливіша подія — конференція GTC від NVIDIA, просто як AI-версія “Короткої історії людства”.

Хуан Женьсюн ще не вийшов на сцену, а інформації, що просочилася, вже вистачило б на цілу книгу.

Ван Ван підготувала три основні моменти, давайте, друзі, йдемо за мною.

  1. Вартість обчислювальної потужності AI знижується до десяти відсотків

Попереднє покоління Blackwell вже було потужним, чи не так? Незабаром буде оголошено про масове виробництво нового чіпа Vera Rubin.

Чим же потужний Vera Rubin? Якщо коротко, два слова: дешева.

Для моделей AI, що працюють одночасно, кількість чіпів зменшується до чверті, а витрати на обчислення знижується на дев’яносто відсотків.
На дев’яносто відсотків, друзі.
Три великі хмарні провайдери AWS, Microsoft та Google відразу ж приєднуються до першої партії.

  1. У минулому році за 20 мільярдів доларів купили Groq, сьогодні — здають домашнє завдання

Раніше Хуан Женьсюн на звіті про результати сказав, що Groq буде інтегровано в екосистему NVIDIA як розширена архітектура, так само як колись купили Mellanox для поліпшення мережевих можливостей.

LPU від Groq буде в одному дата-центрі з GPU від NVIDIA, GPU розуміє проблему, LPU відповідає на запитання швидко.

Ці два чіпи працюють разом, затримка в сценаріях Agent знижується.

AI Agent працює за людей, одне завдання може вимагати десятки циклів моделювання, кожен цикл споживає обчислювальну потужність, а користувач чекає, тому затримка погіршує досвід.

Обчислення поділяється на два етапи: спочатку зрозуміти ваше питання, потім по одному слову дати відповідь.

GPU добре справляється з першим етапом, але швидкість і стабільність другого етапу, в цьому Groq’s LPU сильніший.

20 мільярдів — це дорого?

Подумайте, що в майбутньому кожна компанія буде мати сотні Agent, кожен з яких буде виконувати тисячі циклів моделювання щодня.

  1. NVIDIA запускає свою версію OpenClaw, яка називається NemoClaw

Це набір відкритих платформ, який компанії можуть встановити, щоб розгорнути AI-співробітників для автоматизації процесів, обробки даних та управління проектами.
Кажуть, що вже ведуть переговори з Salesforce та Adobe.

Цікаво, що NemoClaw не вимагає використання чіпів NVIDIA.
Подумайте про цю логіку.
Продаючи чіпи, заробляють лише на апаратному забезпеченні, але визначаючи правила, можна заробити на всьому ланцюгу. Хуан Женьсюн знає, як це порахувати.

  1. Хуан Женьсюн сказав, що продемонструє “чіп, якого світ ніколи не бачив”

Швидше за все, це вперше з’явиться архітектура наступного покоління Feynman, якій буде масове виробництво в 2028 році, з використанням найсучаснішої технології 1,6 нм від TSMC.

Крім того, є ще один маловідомий факт, який мені здається досить цікавим.

NVIDIA випустила процесори для ноутбуків, два варіанти, орієнтовані на ігри.
Ті, хто продає графічні карти, тепер намагаються забрати робочі місця у процесорів.

Ван Ван відчуває, що Хуан Женьсюн стане видатною особистістю в майбутньому.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити