Засновник SemiAnalysis: ринок AI-інференції може перевищити нафту, ставши одним з найбільших ринків у світі.

1 липня Ділан Пател, засновник SemiAnalysis, заявив в інтерв'ю подкасту Sequoia Capital "Training Data", що AI-інференція стане одним з найбільших ринків у світі, потенційно перевершуючи нафту та становлячи кілька відсотків світового ВВП. Він вважає, що кількість і вартість завдань, виконаних після кожної ітерації моделі, продовжують зростати швидше, ніж обчислювальна потужність, що свідчить про те, що дефіцит обчислювальної потужності може зберігатися в довгостроковій перспективі. Пател прогнозує, що до 2030 року сукупний попит на обчислювальну потужність лише OpenAI та Anthropic перевищить 100 гігават; у найближчі 3-5 років вплив космічних дата-центрів залишиться незначним, але до 2040 року понад половина нових обчислювальних потужностей може бути розгорнута в космосі. Він зазначив, що основне обмеження полягає у вартості наземної енергії та здатності генерувати електроенергію. Як тільки економіка космічного розгортання перевершить наземні системи, міграція обчислювальних потужностей у космос стане неминучою. Щодо спільного проєктування апаратного та програмного забезпечення, Пател зауважив, що зростання ефективності ШІ за останні три роки відбулося не в першу чергу завдяки апаратному забезпеченню, а завдяки оптимізації на рівні моделей та міжрівневій спільній оптимізації. Він навів DeepSeek як приклад, зазначивши, що форма його експертної моделі спеціально оптимізована для архітектури Hopper від NVIDIA, що дає чудову продуктивність на Hopper, але погану на TPU; модель Anthropic більше підходить для TPU, тоді як модель OpenAI тяжіє до шляху GPU. Він вважає, що так званий "рів CUDA" — це не просто сам CUDA, а скоріше екосистема відкритих моделей, яка в цілому оптимізується навколо співпраці з GPU. Пател також згадав, що генеральний директор NVIDIA Дженсен Хуанг сильно підтримує нові хмарні компанії, щоб запобігти монополізації великими хмарними провайдерами ландшафту обчислювальних потужностей і сприяти багатополярному ринку. Крім того, система бенчмаркінгу інференції в реальному часі InferenceX, створена командою SemiAnalysis, показує, що при однаковій якості витрати на інференцію зменшились приблизно в 60 разів на рік, а інтелект на ват покращився приблизно в 40 разів.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено