Запуск тієї ж моделі ШІ, кількість чипів скорочується до чверті, а вартість інференційних обчислень падає на 90%. На 90%, друзі. AWS, Microsoft і Google — три головні хмарні провайдери — одразу першими сідають на борт.

Groq, придбаний минулого року за $20 млрд, сьогодні звітує

Раніше Джен-Сюнь Хуан на звіті про результати сказав, що Groq буде інтегровано в архітектуру NVIDIA як розширення, подібно до того, як колись придбання Mellanox доповнило мережеві можливості.

LPU від Groq і GPU від NVIDIA розміщені в одному дата-центрі: GPU розуміють питання, а LPU відповідають за швидке видавання відповідей.

Два типи чипів працюють разом, що безпосередньо знижує затримку в сценаріях Agent.

AI Agent виконує роботу за людину: одне завдання може вимагати десятків ітерацій виклику моделі, кожна з яких спалює інференційні обчислення, до того ж користувач чекає — якщо повільно, досвід руйнується.

Інференція складається з двох кроків: спочатку зрозуміти ваше питання, потім слово за словом видати відповідь.

GPU сильні в першому кроці, але в швидкості та стабільності видавання слів на другому кроці LPU від Groq сильніші.

Чи дорого це коштує $20 млрд?

Подумайте: у майбутньому кожна компанія запускатиме сотні Agentів, кожен Agent тисячі разів на день викликатиме модель.

Версія OpenClaw від NVIDIA вийшла, називається NemoClaw

Це відкрита платформа: підприємства можуть встановити її та розгорнути AI-співробітників, які виконуватимуть процеси, оброблятимуть дані та керуватимуть проектами замість людей. Кажуть, вже ведуть переговори з Salesforce і Adobe.

Цікаво те, що NemoClaw не вимагає використання чипів NVIDIA. Ви самі оцініть цю логіку. Продаючи чипи, заробляють лише на рівні апаратного забезпечення, а встановлюючи правила, можна заробляти на всьому ланцюжку. Джен-Сюнь Хуан чітко прорахував цю бухгалтерію.

Джен-Сюнь Хуан сказав, що покаже «чип, якого світ ще не бачив»

Швидше за все, це перша поява архітектури наступного покоління Feynman, яка вийде у масове виробництво в 2028 році за найпередовішим 1,6-нм техпроцесом TSMC.

Крім того, є ще одна цікава маловідома деталь.

NVIDIA випускає процесори для ноутбуків, дві моделі, орієнтовані на ігри. Продавці відеокарт збираються відібрати хліб у CPU.

Ваньвань відчуває, що Джен-Сюнь Хуан у майбутньому стане великою людиною епохи.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

Нагородити
подобається
Прокоментувати
Репост
Поділіться

Прокоментувати

Додати коментар

Немає коментарів

Популярні теми
Дізнатися більше
#
gStocksTokenizedStocksLive
4,84M Популярність
#
StrongNonfarmPayrollsRekindleRateHikeFear
1,08M Популярність
#
IsraelStrikesIranBTCPlunges
68,92K Популярність
#
PredictWorldCupShare20000U
242,2K Популярність
#
ETHBreaks1700
152,67M Популярність

Закріплено

карта сайту

Найважливіша подія сьогодні — конференція GTC від Nvidia, це просто AI-версія короткої історії людства.

Популярні теми

gStocksTokenizedStocksLive

StrongNonfarmPayrollsRekindleRateHikeFear

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

ETHBreaks1700

Закріплено