Сьогоднішня найважливіша подія — конференція NVIDIA GTC, це фактично історія людства в епоху штучного інтелекту.

robot
Генерація анотацій у процесі

Найважливіша подія сьогодні — конференція GTC від NVIDIA, фактично версія людської історії в галузі штучного інтелекту.

Ще не вийшов на сцену, а вже витік інформації настільки багато, що вистачить на книгу.

Вечірній підсумок трьох головних моментів, поїхали, друзі, йдемо зі мною.

  1. Вартість обчислень для ШІ знизилася вдвічі

Попереднє покоління Blackwell вже було дуже потужним, так? Скоро буде оголошено про масове виробництво нового чипу Vera Rubin.

Чим же особливий Vera Rubin? Простими словами — двома словами: дешевий.

Для однакової моделі ШІ, кількість чипів скорочується до чверті, а вартість обчислень для виведення зменшується на 90%. Зменшення на дев’яносто відсотків, друзі. Три великі хмарні провайдери — AWS, Microsoft, Google — одразу перші, хто підключилися.

  1. Вчора витратили 20 мільярдів доларів на Groq, сьогодні здають роботу

Раніше на фінансовій зустрічі Хуанреньхуна він сказав, що Groq стане розширювальною архітектурою, інтегрованою у систему NVIDIA, — так само, як колись купили Mellanox, щоб доповнити мережеві можливості.

LPU від Groq і GPU від NVIDIA розміщені в одному дата-центрі: GPU розуміє проблему, LPU відповідає швидким виведенням відповіді.

Спільна робота двох типів чипів зменшує затримки у сценаріях агентів.

Штучний агент виконує роботу за людину, один і той самий завдання може проходити десятки раундів налаштування моделі, кожен з яких спалює обчислювальні ресурси для виведення, а користувач чекає — повільніше, і досвід руйнується.

Обчислення для виведення складається з двох кроків: спочатку зрозуміти ваше питання, потім по одному слову видавати відповідь.

GPU добре справляється з першим кроком, але швидкість і стабільність другого — сильна сторона LPU від Groq.

200 мільйонів — дорого?

Уявіть, що кожна компанія в майбутньому матиме сотні агентів, кожен день налаштовуючи тисячі моделей.

  1. Вийшов NVIDIA-версія OpenClaw, називається NemoClaw

Це відкритий платформний комплекс, який компанії можуть встановити для розгортання AI-співробітників, що виконують процеси, обробляють дані та керують проектами. Кажуть, вже ведуть переговори з Salesforce та Adobe.

Цікаво те, що NemoClaw не вимагає використання чипів NVIDIA. Подумайте над цим логікою. Продаж чипів приносить лише прибуток з апаратного забезпечення, а встановлення правил дозволяє заробляти на всій ланцюжку. Хуанреньхуна цю логіку чітко розуміє.

  1. Хуанреньхуна сказав, що він хоче показати «чипи, яких світ ще не бачив»

Майже напевно, це буде перша поява архітектури наступного покоління — Feynman, яка з’явиться вперше, ймовірно, у 2028 році, з найсучаснішою технологією TSMC 1.6 нм.

Ще одна цікава, але менш відома новина.

NVIDIA випустила ноутбучні процесори, дві моделі, орієнтовані на ігри. Тепер виробники відеокарт змагатимуться за частку ринку процесорів.

Вечірній підсумок — здається, Хуанреньхуна стане великим героєм майбутнього.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити