Nvidia частково втрачає частку ринку, де знаходиться новий етап революції штучного інтелекту? Це дев’ята стаття серії «100 статей про інвестиції в AI».


У попередніх статтях розглядалися Intel, AMD, ARM. Їхні цінові показники за минулий рік зросли значно — AMD подвоїлася, Intel потроїлася, ARM досягла історичних максимумів. Після зростання виникає просте питання:
Чи можна ще тримати вже зрослі акції? Чи є ще можливості у тих, хто не піднімався?
Щоб відповісти на це питання, неможливо обійти ключове слово — дедукція. У аналізах цих компаній, що зросли, часто з’являються саме ці два слова.
Отже: наскільки великим є сегмент дедукції? На якій стадії зараз? Які компанії отримають вигоду? Які вже закладені у ринкову ціну, а які — ні?
Це дев’ята стаття серії «100 статей про інвестиції в AI», обсягом 15 000 слів, з багатим і легким для сприйняття змістом, рекомендується спочатку зберегти для перегляду.
1. Наскільки великий сегмент
Навчання моделей — це «писання програми», дедукція — «процес виклику цієї програми щодня». Після тренування GPT, щодня мільярди людей ставлять йому питання, і кожен запит споживає обчислювальні ресурси дедукції. Claude Code виконує одну задачу, агент сам проходить сто раундів, кожен з яких — дедукція.
Багато галузевих досліджень і медіа-джерел вказують у тому ж напрямку: після впровадження моделей у виробниче середовище дедукція стане головною статтею витрат життєвого циклу, з оцінками у діапазоні 80-90%. Тобто у майбутньому, у рахунках за обчислювальні ресурси AI, 8 з 10 гривень витрачатимуться на дедукцію.
Проте останні три роки більшість дискусій зосереджена на тренуванні, оскільки це більш «сексуальна» історія — скільки у кого H100, у кого більше параметрів, хто швидше натренує наступне покоління моделей. Дедукція вважалася побічним процесом після тренування.
Це перекручення уявлень починає змінюватися, і саме це — основна причина переоцінки минулого року напівпровідникових компаній.
Отже, сегмент дедукції великий, але наскільки саме? Це можна оцінити за п’ятьма аспектами.
Перший — кількість користувачів. ChatGPT має 900 мільйонів активних користувачів щотижня, 50 мільйонів платних. У Китаї ситуація ще більш очевидна — щоденне використання токенів зросло з 100 мільярдів на початку 2024 року до 140 трильйонів у 2026 році, у 1400 разів. Цей показник ще далеко не насичений.
Другий — інтенсивність використання. Обсяг обробки токенів OpenAI у жовтні 2025 року становив 6 мільярдів на хвилину, у квітні 2026 року вже 15 мільярдів — за півроку зросло у 2,5 рази. Доходи від корпоративної версії перевищують 40%, а корпоративні користувачі використовують у десятки разів активніше, ніж споживачі.
Третій — довжина діалогу. Контекстний обсяг з початкових кількох сотень токенів зріс до 1 мільйона у API-документації DeepSeek V4 Pro / Flash, максимальний вихід — 384 тисячі. Чим довший документ, тим більше пам’яті та обчислювальних ресурсів потрібно для однієї дедукції.
Четвертий — сама модель стає все більш ресурсомісткою. Моделі дедукції, такі як OpenAI o1, DeepSeek R1, Claude thinking, перед відповіддю «думають» внутрішньо кілька тисяч або десятки тисяч токенів. Хо Яньхун, колишній голова NVIDIA, на прикладі DeepSeek R1 зазначав, що дедукційні моделі можуть потребувати набагато більшої кількості обчислень, навіть у сотні разів.
Раніше, задаючи AI питання, ви отримували відповідь одразу; тепер — якщо поставите складне питання, AI спершу «подумки» витратить півхвилини, перш ніж відповісти. Це «думання» — новий витратний фактор.
П’ята — агент. Зазвичай один агент виконує 10-100 викликів моделі. Щотижнева активність OpenAI Codex вже перевищила 4 мільйони (станом на 22 квітня 2026 року) — це лише один продукт однієї компанії. Оцінка фахівця з AI-індустрії — загальні витрати на обчислювальні ресурси AI-агентів можуть перевищувати у 10 разів витрати великих мовних моделей з аналогічною кількістю параметрів.
Перемножуючи ці п’ять факторів, можна зробити висновок, що у найближчі 3-5 років попит на дедукцію зросте у кілька порядків — це не перебільшення, а все більш поширена імовірність.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити