Наступила ли эпоха ИИ-рассуждений? Триумвират вычислительной мощности: GPU, CPU и ASIC

Question

22 июня 2026 года американский фондовый рынок в секторе чипов показал массовый рост — индекс полупроводников Филадельфии вырос за день на 6,42%, Intel подорожала более чем на 10% на новости о совместном производстве чипов с Apple, ADR TSMC вырос на 6,94%, закрывшись на отметке 462,12 доллара, Nvidia прибавила почти 3%. За этим рыночным настроением скрывается ускоряющееся индустриальное суждение: структура спроса на AI-вычислительные мощности сместилась с обучения на вывод.

По данным отраслевых аналитиков, доля выводных задач в общем спросе на AI-вычисления выросла с примерно трети в 2023 году до двух третей в 2026 году, ожидается, что к 2028–2030 годам она достигнет 70–85%. Эта структурная перемена переопределяет основные боевые поля конкуренции за чипы — от «кто быстрее обучает GPU» к «кто обеспечивает минимальные общие издержки на вывод и максимальную пропускную способность».

Мировой рынок AI-выводных чипов в 2024 году оценивается в 85,4 миллиарда долларов, прогнозируется рост с 105,47 миллиарда долларов в 2025 году до 570,77 миллиарда долларов к 2033 году, с совокупным среднегодовым ростом 23,5% в прогнозный период. В частности, рынок облачных AI-выводных чипов в 2025 году оценивается в 102,19 миллиарда долларов, к 2026 году ожидается рост до 118,9 миллиарда долларов, а к 2032 году — до 320,98 миллиарда долларов. В то же время, глобальный рынок граничных AI-чипов (суммарно для вывода и обучения) ожидается, что увеличится с 34,4 миллиарда долларов в 2026 году до 96 миллиардов долларов в 2031 году.

В рамках этого цикла расширения соотношение сил между типами чипов претерпевает тонкие и глубокие изменения. GPU по-прежнему остается крупнейшим сегментом рынка, при поддержке как обучения, так и вывода, прогнозируется, что к 2031 году его среднегодовой рост составит 20%. Однако AI-ASIC рассматриваются многими аналитиками как наиболее быстрорастущий сегмент. Аналитики JPMorgan оценивают рынок цифровых AI-ASIC к 2026 году примерно в 60–70 миллиардов долларов, с ожидаемым ростом более 40–50% в год.

Более того, возвращение CPU на сцену заслуживает особого внимания. В течение последних трех лет CPU находились на периферии AI-нарратива, но взрыв спроса на выводные задачи меняет эту ситуацию.

Почему CPU возвращается на главную сцену

AI-вывод и обучение отличаются по своей вычислительной логике. Обучение — это масштабный параллельный матричный расчет — десятки триллионов плавающих точек могут выполняться одновременно на тысячах GPU-ядер, что является абсолютной сильной стороной GPU. Но вывод, особенно в агентном AI (Agentic AI), включает задачи оркестровки, вызова инструментов, многошаговой логики и последовательных решений. Эти нагрузки не являются чисто параллельными вычислениями, а требуют сложной логики, управляемой CPU, и последовательной обработки.

Исследование Georgia Tech и Intel показывает, что в сценариях агентного AI от 50% до 90% задержки обусловлены CPU, а не вычислительными чипами — потому что крупные модели вызывают плагины, ищут в сети, обрабатывают многошаговую логику, и всё это управляется CPU. Сам Nvidia в марте 2026 года признала этот факт: её топ-менеджер Dion Harris заявил публично, что «CPU становится узким местом в AI-рабочих потоках» — что удивительно для компании, которая считает GPU единственным необходимым чипом для AI.

Изменения в соотношении конфигураций позволяют более наглядно понять тенденцию. В стадии обучения AI соотношение CPU и GPU обычно достигает экстремального уровня 1:8, где GPU берет на себя основную часть расчетной нагрузки. Но в эпоху вывода, согласно отчету TrendForce, это соотношение быстро приближается к диапазону 1:1 — 1:2. Генеральный директор Intel, Чэнь Ливу, на квартальной конференции по финансовым результатам в первом квартале 2026 года отметил, что для обучения обычно требуется 7–8 GPU на один CPU, а для вывода — уже 3–4 GPU на один CPU, и в будущем это соотношение может еще больше сблизиться к 1:1.

Если взять за ориентир оценку CEO Nvidia, Джона Ху, — для каждого GW дата-центра требуется примерно 300 тысяч Rubin GPU, а при пересчете на ARM CPU с 136 ядрами на процессор — около 221 тысячи CPU на GW. Новое соотношение CPU и GPU — примерно 1:1,4. По сравнению с эпохой GPU-ведущего доминирования, роль CPU значительно выросла.

Защитные преимущества GPU и вызовы для сценариев вывода

Несмотря на возвращение CPU, GPU по-прежнему занимает ключевую позицию в AI-выводе благодаря двум важнейшим аспектам: пропускной способности памяти и параллельной пропускной способности.

В процессе вывода больших языковых моделей (LLM) для генерации каждого токена требуется чтение сотен миллионов — до сотен миллиардов — параметров, что является типичной задачей с высокой плотностью памяти. Решения на CPU используют системную DDR-память, пропускная способность которой обычно составляет 50–100 ГБ/с; в то время как GPU используют GDDR6X или HBM, где пропускная способность достигает 800 ГБ/с и выше, а у высокопроизводительных GPU с HBM2e — до 1,5 ТБ/с, что в 20 раз превышает CPU. В случае модели Llama 3.1 8B, вывод на CPU достигает всего 819 токенов в секунду, тогда как кластер из 8 GPU — 46 841 токен в секунду. При увеличении числа одновременных запросов производительность CPU резко падает до 257 токенов в секунду, а GPU — практически не теряет эффективности.

В плане плотности вычислений GPU достигает сотен TFLOPS за счет тысяч CUDA-ядер, поддерживая низкоразрядные форматы FP4/FP8, тогда как CPU обычно работает в диапазоне 1–10 TFLOPS по FP32.

Эти показатели подтверждают, что в сценариях с высокой пропускной способностью и большим числом одновременных запросов — например, в облачных AI-сервисах для массовых пользователей — GPU остается оптимальным решением. Лидерство Nvidia в этой области пока не подлежит сомнению. Согласно данным SemiAnalysis, в первом квартале 2026 года Nvidia занимает 92% рынка обучающих чипов для AI и 78% — для вывода. IDC оценивает долю Nvidia примерно в 81% рынка AI-чипов. Общий рынок AI-ускорителей в 2025 году оценивается примерно в 160 миллиардов долларов, а к 2026 году — более 200 миллиардов, при этом расходы на выводные чипы, по прогнозам, составляют около двух третей.

Однако доля GPU в сценариях вывода сталкивается с множеством вызовов — возвращением CPU, конкуренцией со стороны ASIC и реальностью стоимости.

Контратака CPU в сценариях вывода

Переоценка роли CPU в выводных задачах уже превращается в конкретную рыночную динамику.

Рынок дата-центровых процессоров быстро растет под воздействием спроса на генеративный AI, ожидается, что к 2031 году он достигнет 656 миллиардов долларов, с текущих 215 миллиардов в 2025 году. Аналитики China Securities отмечают, что крупные дата-центры входят в фазу «обновления», и к 2026 году поставки серверных CPU могут вырасти на 25%.

Явным бенефициаром этой тенденции является AMD. Рост спроса на AI-серверы стимулировал поставки CPU серии EPYC, а пятое поколение Turin уже занимает значительную долю рынка серверных CPU. В 2026 году ожидается рост этого сегмента минимум на 50%. Аналитики Bernstein прогнозируют, что продажи флагманских процессоров AMD EPYC в 2026 году могут вырасти на 30%. На рынке серверных CPU к началу 2026 года Intel занимает около 60%, AMD — около 24%, Nvidia — около 6%. AMD также конкурирует с Nvidia в сегменте AI GPU с помощью ускорителей Instinct, что создает для нее уникальную позицию в эпоху вывода.

Intel также активно перестраивается. На выставке Computex в июне 2026 года новый CEO Intel, Чэнь Ливу, объявил о возвращении CPU в центр внимания с помощью архитектуры 18A и модульной системы «разделения» (rack-level decoupling). Он подчеркнул, что в эпоху вывода CPU снова становятся ключевыми, а инфраструктура AI переходит от «комплекта» к «конструктору Lego». Встроенная технология расширения матриц (AMX) в процессорах Xeon позволяет ускорять выводные задачи крупных языковых моделей без необходимости использования GPU или других ускорителей.

Самое символичное изменение — это шаг Nvidia. Эта компания, определившая эпоху AI через GPU, в 2026 году начала выпускать линейки CPU Grace и Vera, причем Vera специально ориентирована на вывод и агентный AI. Nvidia прогнозирует, что доходы от CPU в 2026 году достигнут 20 миллиардов долларов. В 2026 году Nvidia и Arm запустили отдельные CPU-линейки, что стало официальным входом этой компании в рынок CPU.

Рост рынка ASIC и специализированных чипов

Помимо двухполюсной истории GPU и CPU, ASIC (специализированные интегральные схемы) становятся наиболее быстрорастущим сегментом в рынке вывода.

По прогнозам TD Cowen, доля коммерческих ускорителей снизится с примерно 91% в 2025 году до около 75% в 2030 году, а доля кастомных ASIC — увеличится с 9% до 25%. Ожидается, что поставки ASIC-серверов в 2026 году вырастут на 44,6%, тогда как GPU — только на 16,1%, что в три раза меньше.

Крупные облачные провайдеры ускоренно разрабатывают собственные ASIC для вывода. Google TPU, AWS Inferentia, Meta MTIA и LPU (Language Processing Unit) от Groq — все эти чипы оптимизированы под выводные задачи. Broadcom во втором квартале 2026 года зафиксировала доходы от AI в 10,8 миллиардов долларов, что на 143% больше по сравнению с прошлым годом, а годовой прогноз — 56 миллиардов долларов, рост на 180%. Broadcom планирует занять около 60% рынка кастомных AI-чипов.

Эта тенденция означает, что рынок выводных чипов переходит от «глобального доминирования GPU» к «многослойной системе» — GPU отвечает за тяжелое обучение и крупномасштабный вывод, CPU — за оркестровку и системное управление, а ASIC — за энергоэффективность в конкретных задачах вывода.

Структура затрат и переосмысление экономики вывода

Выбор чипа для вывода сводится к одному ключевому вопросу: сколько стоит один миллион токенов вывода.

На этапе обучения важны точность модели и время обучения, и затраты допускаются выше. Но вывод — это постоянная, высокочастотная деятельность, каждое API-вызов и пользовательский запрос несет прямые издержки. Поэтому конкуренция среди чипов в этом сегменте сместилась с «абсолютной производительности» к «эффективной пропускной способности за единицу стоимости».

Стоимость аппаратного обеспечения GPU выше. Например, AMD MI300X стоит около 10–15 тысяч долларов, а Nvidia H100 — 25–40 тысяч долларов. Но стоимость единицы вычислительной мощности у GPU ниже — например, по данным одного облачного провайдера, стоимость генерации одного токена в секунду на GPU примерно на 40–60% ниже, чем на CPU. Решения на CPU выигрывают в сценариях с низкой параллельностью и низкой задержкой, где важна единичная задача.

Однако при увеличении масштаба вывода маржинальные издержки CPU растут быстрее — при росте числа одновременных запросов CPU вынуждено переключать задачи, что вызывает накладные расходы на контекстные переключения, экспоненциально увеличивающиеся с ростом параллелизма. В масштабных развертываниях GPU или ASIC позволяют добиться более высокой пропускной способности и меньших затрат на единицу вывода, обеспечивая лучший долгосрочный ROI.

Итоги

Доля вывода в вычислительных мощностях выросла с трети до двух третей — за этим изменением скрывается глубокая трансформация логики конкуренции в индустрии чипов.

Для Nvidia, несмотря на доминирование в обучающем сегменте (около 90%), в ближайшие годы трудно ожидать существенного снижения этой доли, однако конкуренция в сегменте вывода станет более острой. По прогнозам New Street Research, к 2028 году доля Nvidia в выводных чипах может снизиться до 20–30%. Даже по более консервативным оценкам Bloomberg Intelligence, к 2030 году Nvidia сохранит около 70–75% рынка, а рост поставок ASIC значительно опережает GPU.

Для AMD и Intel рост спроса на CPU для вывода — это структурная возможность. AMD с двойной стратегией — EPYC CPU и Instinct GPU, а Intel с архитектурой 18A и постоянной итерацией процессоров Xeon — пытаются захватить этот тренд.

Для облачных провайдеров и разработчиков AI-приложений увеличение вариантов выбора чипов означает более тонкую оптимизацию затрат. От универсальных GPU к кастомным ASIC, от CPU к GPU-ускорителям — выбор аппаратуры все больше зависит от конкретных рабочих нагрузок: масштаб модели, требования к задержкам, уровень параллелизма, бюджет.

Потребность в вычислительных мощностях для вывода растет быстрее, чем для обучения. Этот сдвиг фокуса с обучения на вывод переопределяет всю цепочку индустриальных процессов — от проектирования чипов до архитектуры дата-центров. GPU не исчезнет, но уже не будет единственным ответом.

Посмотреть Оригинал

Наступила ли эпоха ИИ-рассуждений? Триумвират вычислительной мощности: GPU, CPU и ASIC

Почему CPU возвращается на главную сцену

Защитные преимущества GPU и вызовы для сценариев вывода

Контратака CPU в сценариях вывода

Рост рынка ASIC и специализированных чипов

Структура затрат и переосмысление экономики вывода

Итоги

Популярные темы

MyGateTradeStory

IsraelStrikesIranBTCPlunges

PredictWorldCup🇺🇸vs🇵🇾

TradFiCFDGoldMaster

GateProofOfReservesReport

Закреплено