Засновник SemiAnalysis: Ринок AI-інференсу може перевищити нафту, ставши одним з найбільших ринків у світі

1 липня Ділан Пател, засновник SemiAnalysis, заявив в інтерв'ю подкасту Sequoia Capital "Training Data", що AI-інференція стане одним з найбільших ринків у світі, потенційно перевершивши нафту та становитиме кілька відсотків світового ВВП. Він вважає, що кількість і цінність завдань, виконаних після кожної ітерації моделі, продовжують розширюватися темпами, швидшими за зростання обчислювальної потужності, що свідчить про можливе збереження дефіциту обчислювальних потужностей у довгостроковій перспективі. Пател прогнозує, що до 2030 року сукупний попит на обчислювальну потужність лише OpenAI та Anthropic перевищить 100 гігават; протягом наступних 3-5 років вплив космічних центрів обробки даних залишатиметься незначним, але до 2040 року понад половина нових обчислювальних потужностей може бути розгорнута в космосі. Він зазначив, що ключове обмеження полягає у вартості наземної енергії та можливості виробляти електроенергію. Як тільки економіка космічного розгортання перевершить наземні системи, міграція обчислювальних потужностей у космос стане неминучою. Стосовно спільного проєктування апаратного та програмного забезпечення Пател зауважив, що зростання ефективності ШІ за останні три роки відбулося не в першу чергу завдяки апаратному забезпеченню, а завдяки оптимізації на рівні моделей та міжрівневій спільній оптимізації. Він навів DeepSeek як приклад, зазначивши, що форма його експертної моделі спеціально оптимізована під архітектуру Hopper від NVIDIA, що дає відмінну продуктивність на Hopper, але погану на TPU; модель Anthropic більше підходить для TPU, тоді як модель OpenAI схиляється до траєкторії GPU. Він вважає, що так званий "рів CUDA" — це не просто CUDA сама по собі, а екосистема моделей з відкритим кодом, яка загалом оптимізується навколо співпраці з GPU. Пател також згадав, що сильна підтримка генерального директора NVIDIA Дженсена Хуанга нових хмарних компаній спрямована на запобігання монополізації великими хмарними провайдерами ринку обчислювальних потужностей та сприяння багатополярному ринку. Крім того, система бенчмаркінгу інференції в реальному часі InferenceX, створена командою SemiAnalysis, показує, що за однакової якості витрати на інференцію зменшилися приблизно в 60 разів щороку, а інтелект на ват покращився приблизно в 40 разів.
DEEPSEEK-0,85%
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено