За последние два года NVIDIA, производители памяти и поставщики энергоресурсов доминировали в распределении доходов от инвестиций в ИИ, но по мере ускорения коммерциализации агентного ИИ (Agentic AI) прибыль на уровне моделей расширяется с беспрецедентной скоростью, в то время как NVIDIA и TSMC, контролирующие предложение вычислительных мощностей, еще не в полной мере отразили эту тенденцию в ценах.

Anthropic является наиболее прямым примером этого сдвига. Согласно последнему исследованию SemiAnalysis, годовой регулярный доход (ARR) Anthropic вырос с $9 млрд в начале года до более чем $44 млрд, а валовая прибыль ее инфраструктуры вывода за тот же период выросла с 38% до более чем 70%. В то же время затраты на производство токенов значительно снизились благодаря обновлению оборудования и оптимизации программного обеспечения, а разрыв между стоимостью и затратами продолжает расширяться, переводя производителей моделей в новую фазу быстрого роста маржинальности.

На стороне предложения NVIDIA и TSMC владеют самыми дефицитными ресурсами, но еще не адекватно отреагировали ценами на текущий всплеск спроса. SemiAnalysis считает, что это отставание в ценообразовании формирует важный рыночный дисбаланс: системы следующего поколения, такие как Vera Rubin (VR NVL72), имеют значительный потенциал для повышения цен, и кто первым воспользуется этим перераспределением стоимости, глубоко повлияет на инвестиционную логику всех звеньев цепочки ИИ.

Траектория перемещения пула стоимости ИИ за три года

С 2023 по 2025 год сверхдоходы от инвестиций в ИИ были сосредоточены в основном в инфраструктурном слое.

NVIDIA впервые опубликовала рекордный отчет о прибылях в мае 2023 года, взлетев на 25% после закрытия торгов, официально начав волну инвестиций в ИИ. В 2024 году Vistra и GE Vernova выросли на 265% и 146% соответственно, войдя в число лучших акций S&P 500, а узкие места в энергоснабжении стали центром внимания рынка. В 2025 году сектор памяти подхватил лидерство: SanDisk, Western Digital, Seagate и Micron показали рост более чем на 200% за год, а дисбаланс спроса и предложения в хранении данных стал ключевой переменной, определяющей цены.

Тем временем валовая прибыль производителей моделей и сервисов вывода долгое время находилась под давлением. Тогдашнюю фактическую полезность ИИ критики считали не более чем «улучшенным поиском Google» с чат-интерфейсом, что резко контрастировало с ожидаемыми капитальными затратами в триллионы долларов.

Эта ситуация коренным образом изменилась в конце 2025 года.

Агентный ИИ: поворотный момент, меняющий экономику токенов

SemiAnalysis считает декабрь 2025 года настоящим поворотным моментом в коммерциализации ИИ — агентный ИИ начал стабильно работать и массово внедряться в корпоративные рабочие процессы. Основное значение этого изменения заключается в том, что оно фундаментально изменило экономическую ценность токенов.

На примере самой SemiAnalysis: ее годовой расход токенов уже эквивалентен примерно 30% от общего объема зарплат сотрудников, при этом каждый сотрудник ежемесячно потребляет более 5 миллиардов токенов, что более чем в 5 раз превышает средний показатель на одного человека внутри Meta. Исследовательская группа привела несколько реальных примеров: задачи, на которые раньше у младших аналитиков уходили часы (финансовое моделирование, построение графиков, анализ доходов), теперь выполняются агентом за ничтожные затраты токенов, тогда как эквивалентные затраты на человеческий труд могли составлять сотни или тысячи долларов.

Тем временем затраты на производство токенов резко падают. SemiAnalysis оценивает, что в сценариях задач агентов фактическая гибридная цена работы Opus 4.7 составляет около $0,99 за миллион токенов, что значительно ниже официальной цены в $5/$25 — причина в том, что рабочая нагрузка агентов имеет чрезвычайно высокое соотношение ввода-вывода (примерно 300:1) и уровень попадания в кэш более 90%, что приводит к попаданию большого количества токенов в самые низкие ценовые категории.

Ускорение на уровне оборудования также значительно. По сравнению с H100 годичной давности, серия Blackwell обеспечивает примерно в 30 раз большее количество генерируемых токенов в секунду при передовых рабочих нагрузках. Дальнейшее сравнение показывает, что GB300 NVL72 в оптимальной конфигурации обеспечивает примерно в 17 раз большую пропускную способность в точности FP8 по сравнению с оптимальным H100, а при переходе на FP4 этот разрыв увеличивается до 32 раз, при этом общая стоимость владения (TCO) превышает всего на 70%.

Двусторонний ножничный разрыв между стоимостью и затратами — именно он является ключевым драйвером роста валовой прибыли Anthropic с 38% до более чем 70%.

Ценообразование на уровне моделей: почему конкуренция его не подорвет

Перед лицом быстрого расширения маржинальности производителей моделей наиболее распространенный вопрос рынка: конкуренция в конечном итоге снизит цены. SemiAnalysis с этим не согласна и приводит два аргумента.

Во-первых, ценообразование передовых закрытых моделей остается устойчивым. Несмотря на то, что открытые модели постоянно обновляют свои результаты в бенчмарках, в реальных сценариях интеллектуальной работы они все еще значительно уступают передовым закрытым моделям. Например, Kimi K2.6 (цена $0,95/$4) оказывает очень ограниченное понижательное давление на ценообразование Anthropic Opus.

Во-вторых, ограничения вычислительных мощностей означают, что ни одна передовая лаборатория не может самостоятельно удовлетворить весь рыночный спрос. Anthropic уже начала активно управлять спросом, блокируя Claude Code за подпиской стоимостью более $100 в месяц и ограничивая сторонний доступ. Спрос на токены будет продолжать превышать предложение в обозримом будущем. Этот структурный дефицит дает производителям передовых моделей уверенность в ценообразовании на основе стоимости, а не затрат.

Anthropic уже реализовала эту логику через стратегию продуктовой линейки: цена Opus fast в 6 раз выше обычного Opus, предстоящий Mythos стоит $25/$125, что в 5 раз выше обычного Opus, и ведущие корпоративные клиенты все равно готовы платить за эти дорогие SKU. SemiAnalysis отмечает, что если бы Anthropic установила цену Mythos fast на уровне $150/$750, она сама была бы платящим пользователем.

NVIDIA и TSMC: отставание в ценообразовании дефицитных ресурсов

Однако две компании, контролирующие наиболее критически дефицитные ресурсы — NVIDIA и TSMC — не успевают за этой волной переоценки.

Производственные мощности TSMC по передовому техпроцессу N3 стали самым узким местом во всем расширении вычислительных мощностей ИИ. NVIDIA, Broadcom, Annapurna, MediaTek и AMD конкурируют за ограниченные квоты на пластины N3, а загрузка мощностей N3, по прогнозам, превысит 100% во второй половине 2026 года. Загрузка заводов DRAM уже превысила 90%, общее предложение памяти напряжено, но ценообразование относительно консервативно.

SemiAnalysis считает, что TSMC имеет все условия для значительного повышения цен, и клиенты не только примут это, но некоторые даже приветствуют — яркий пример: NVIDIA: если TSMC повысит цены, это будет означать, что конкуренты получат меньше квот, и NVIDIA, платя более высокие цены за пластины, наоборот, укрепит свои рыночные позиции. Генеральный директор NVIDIA Дженсен Хуанг в 2024 году публично заявил, что TSMC следует поднять цены на пластины — логика этого и заключается в данном тезисе.

Собственная ценовая политика NVIDIA также демонстрирует аналогичную консервативность. SemiAnalysis отмечает, что структура ценообразования NVIDIA по-прежнему опирается на старую гипотезу о том, что «цена, которую готовы платить за единицу вычислительной мощности, со временем снижается», но эта гипотеза больше не работает. С взрывным ростом рабочих нагрузок агентов спрос на вычислительные мощности больше не является линейным, а демонстрирует ускоряющийся композитный рост.

Система Rubin: количественная оценка ценового пространства NVIDIA

Используя в качестве ориентира Vera Rubin (VR NVL72), которая выйдет во второй половине 2026 года, SemiAnalysis построила аналитическую рамку ценообразования «Один график, чтобы править всеми» (One Chart to Rule Them All), определяющую нижнюю и верхнюю границы арендной платы со стороны затрат и стоимости.

Со стороны затрат (нижняя граница): исходя из порога развертывания, при котором внутренняя норма доходности (IRR) проектов Neocloud (новых облачных провайдеров) не ниже 15,6%, минимальная арендная плата за GPU в час для VR NVL72 должна составлять около $4,92, чтобы сохранить заинтересованность Neocloud в развертывании.

Со стороны стоимости (верхняя граница): привязываясь к текущей арендной ставке GB300 по 5-летнему контракту около $0,70 за PFLOP, верхний предел арендной платы для VR NVL72 составляет примерно $12,25 за GPU в час.

В настоящее время ценообразование системы VR NVL72 позволяет снизить стоимость одного PFLOP примерно до $0,28, что на 60% меньше по сравнению с GB300 NVL72, что значительно превышает улучшения исторического тренда. Это означает, что цена серверов NVIDIA может быть повышена примерно на 40%, и даже после повышения цен Neocloud все равно сохранит достаточную прибыль, а общий выигрыш в стоимости все равно будет ниже исторического тренда.

Ценообразование на память SOCAMM — еще одна ключевая переменная. VR NVL72 использует модули памяти LPDDR5X с разъемами (SOCAMM), которые можно ценировать отдельно от вычислительных блоков. SemiAnalysis оценивает, что контрактная цена SOCAMM, которую NVIDIA платит в первом квартале 2026 года, составляет около $8 за ГБ, что является значительным скачком по сравнению с предыдущим кварталом; ожидается, что к концу 2026 года цена SOCAMM может превысить $13 за ГБ. В этом контексте валовая маржа NVIDIA на SOCAMM в 60% является логически обоснованной: с одной стороны, предложение памяти ограничено, а NVIDIA обладает преимуществом наибольшей доли; с другой стороны, лидерство VR NVL72 в производительности TCO оставляет клиентам мало альтернатив.

Кому достается стоимость: кто выигрывает, кто ждет

Рамка SemiAnalysis раскрывает ключевое противоречие в текущем распределении стоимости ИИ: улучшение экономики токенов быстро повышает прибыль производителей моделей, сервисов вывода и Neocloud, но как контролер самого дефицитного ресурса на стороне предложения вычислительных мощностей, поведение ценообразования NVIDIA и TSMC имеет явное несоответствие с их дефицитностью предложения.

Продолжение этого несоответствия по сути является осознанным выбором — NVIDIA играет роль, подобную «Центральному банку ИИ», передавая стоимость вниз по цепочке через повышение эффективности программного обеспечения, чтобы поддерживать долгосрочный импульс расширения экосистемы и одновременно избегать антимонопольного давления. TSMC придерживается своей исторической философии ценообразования «стабильная экосистема, не выжимать всю выгоду от подъема».

Однако по мере того, как рентабельность вывода становится все более очевидной, а логика ценообразования на основе стоимости распространяется на рынке, давление на эти две компании для перехода к рамкам ценообразования на основе стоимости будет нарастать. Как только переход произойдет, структура распределения стоимости в цепочке ИИ снова изменится — тогда переговорная сила на стороне предложения вычислительных мощностей в большей степени вернется к аппаратному слою.

Предупреждение о рисках и отказ от ответственности

        Рынок сопряжен с рисками, инвестиции требуют осторожности. Данная статья не является индивидуальной инвестиционной рекомендацией и не учитывает особые инвестиционные цели, финансовое положение или потребности отдельных пользователей. Пользователи должны оценивать, соответствуют ли какие-либо мнения, взгляды или выводы в этой статье их конкретной ситуации. Инвестируя на основе этой информации, вы принимаете на себя все риски.

TOKEN-3,03%

VR-0,37%

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .

Награда
лайк
комментарий
Репост
Поделиться

комментарий

Добавить комментарий

Нет комментариев

Популярные темы
Подробнее
#
SKHynixTopsKOSPIByMarketCap
1,66M Популярность
#
MicronEarningsBeatExpectationsSharesRise
357,89K Популярность
#
IsraelStrikesIranBTCPlunges
65,66K Популярность
#
PredictWorldCupShare20000U
129,57K Популярность
#
USMayPCEInflationRisesTo4.1%HighestIn3Years
605,53K Популярность

Закреплено

Карта сайта

SemiAnalysis: От инфраструктуры до уровня моделей — перемещение богатства в цепочке создания стоимости ИИ ускоряется.

Траектория перемещения пула стоимости ИИ за три года

Агентный ИИ: поворотный момент, меняющий экономику токенов

Ценообразование на уровне моделей: почему конкуренция его не подорвет

NVIDIA и TSMC: отставание в ценообразовании дефицитных ресурсов

Система Rubin: количественная оценка ценового пространства NVIDIA

Кому достается стоимость: кто выигрывает, кто ждет

Популярные темы

SKHynixTopsKOSPIByMarketCap

MicronEarningsBeatExpectationsSharesRise

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

USMayPCEInflationRisesTo4.1%HighestIn3Years

Закреплено