Роуфоли: За блокировкой подписки Claude на лобстеров настоящая альтернатива — это не более дешёвые токены

MaticHoleFiller · 2026-04-06T09:58:23+00:00

В эпоху Agent руководитель крупной модели Xiaomi MiMo Ло Фули отметил, что текущая модель оплаты по токенам уже не справляется с вызовами, и требуется более умный способ использования вычислительных ресурсов. Anthropic прекратила модель пользовательской подписки, что выявило структурные проблемы в AI-экономике, и подталкивает к улучшению сторонних фреймворков, подчеркивая важность управления вычислительной мощностью. Реакция разных сторон на эту трансформацию неоднозначна, и в будущем рынку нужно будет перейти от грубого использования к более детализированной архитектуре.

MaticHoleFiller

2026-04-06 09:58:23

Генерация тезисов в процессе

（Источник: Машина разума）

Редакция «Машина разума»

В эпоху агентных платформ нам нужны правильные принципы биллинга и инженерного проектирования — такие соображения только что высказала на X руководитель проекта LLM компании Xiaomi MiMo Ло Фули.

Несколько дней назад мы сообщали новость — Anthropic объявила: начиная с сегодняшнего дня пользователям подписок Claude Pro и Max больше нельзя использовать лимиты подписки для сторонних агентских фреймворков вроде OpenClaw. Хотите продолжать использовать? Тогда нужно переключиться на оплату по факту потребления через API. Из‑за этого многие пользователи Claude, которые «играли в “лобстера”» на подписочной модели, мгновенно растерялись.

Официальное объяснение Anthropic сводится к тому, что подписочная модель ценообразования изначально была рассчитана на «обычную интенсивность использования личными пользователями», но использование автоматизированных агентских инструментов вроде OpenClaw оказалось существенно выше ожиданий: тяжелые пользователи каждый месяц платят всего 200 долларов подписки, но при этом потребляют вычислительные ресурсы на 5000 долларов, что создает для Anthropic огромную нагрузку по затратам.

После выхода новости реакции оказались разными: кто‑то воскликнул «это настоящее предательство», считая, что у подписочной модели мгновенно исчезла привлекательность; а кто‑то поддержал решение, полагая, что таким образом очищают неэффективное использование и защищают устойчивость всей платформы.

Какие бы ни были голоса, на первый план выходит ключевая проблема: текущая token‑биллинговая модель уже с трудом справляется с вызовами — нам нужна более умная и более устойчивая модель использования вычислительных мощностей.

В своем посте Ло Фули в первую очередь указала, что подписочная модель Anthropic изначально работала с убытком.

Подписочная модель Claude Code — это набор с тщательно продуманной системой баланса распределения вычислительных ресурсов. Мое мнение: — с высокой вероятностью она не приносит прибыли, и даже может работать в минус, если только у них нет API‑прибыли в 10–20 раз больше, но я в этом сомневаюсь. Насколько велик убыток от подключения сторонних фреймворков, я не могу точно посчитать, но я близко видел контекст‑менеджмент в OpenClaw — он написан плохо. В рамках одного запроса пользователя оно запускает несколько раундов низкоценностных вызовов инструментов; каждый раз это отправляется как отдельный API‑запрос, и каждый раз с собой уносит очень длинное окно контекста (часто больше 100 тысяч token) — даже при совпадении кэша это крайне нерационально. В крайних случаях оно еще и повышает вероятность несовпадения кэша для других запросов.

В пересчете: количество API‑вызовов, которые реально триггерит каждый пользовательский запрос, оказывается в несколько раз больше, чем у собственного фреймворка Claude Code. Переводя это в цену API, реальная стоимость примерно в десятки раз выше подписочной цены. Это не просто разница — это ловушка.

Относительно болезненности, с которой столкнулись подписчики в связи с этим отрезанием, она считает: в долгосрочной перспективе это принесет пользу, заставив двигаться инженерно вперед.

OpenClaw, OpenCode и подобные сторонние фреймворки все еще могут вызывать Claude через API, просто больше нельзя будет «ехать на подписке». В краткосрочной перспективе агент‑пользователи будут очень страдать — затраты легко подскочат в десятки раз. Но эта нагрузка как раз и станет импульсом к тому, чтобы эти фреймворки серьезно улучшили контекст‑менеджмент, максимизировали вероятность попаданий в prompt‑кэш для повторного использования уже обработанного контекста и сократили расход бесполезных token. Боль в итоге превратится в инженерную дисциплину.

Одновременно она добавила предупреждение: не стоит крупным компаниям, работающим с большими моделями, слепо ввязываться в ценовые войны. Продавать дешевые Token и при этом позволять третьим сторонам «обдирать» это инструментами — это ловушка.

Я хочу посоветовать производителям больших моделей: прежде чем вы не разобрались, как назначать подписочную цену для coding — так, чтобы не уйти в сильный перерасход, — не надо бездумно закапываться в ценовое дно. Продавать token совсем за копейки, одновременно широко открывая двери для сторонних фреймворков — внешне это как будто дружелюбно для пользователей, но по сути это ловушка — Anthropic только что выбралась из этой ловушки. Более глубокая проблема в том, что если пользователи потратят время и усилия на некачественные агентские фреймворки, на крайне нестабильные и медленные сервисы вывода, на модели, урезанные ради снижения себестоимости, а в итоге обнаружат, что все равно ничего не удается сделать — это будет порочный цикл и для пользовательского опыта, и для удержания.

Далее она также рассказала о недавно запущенном Xiaomi MiMo Token Plan и подчеркнула, что они «стремятся обеспечивать долгосрочно стабильную поставку высококачественных моделей и сервисов».

Про MiMo Token Plan — он поддерживает подключение сторонних фреймворков, оплачивается по лимиту token; логика совпадает с недавно запущенным у Claude пакетом extra usage. Потому что мы стремимся к долгосрочно стабильной поставке высококачественных моделей и сервисов — а не к тому, чтобы вы impulsively оплатили, а затем сошли с корабля.

В конце она отметила: сейчас глобального предложения вычислительных мощностей уже недостаточно для token‑потребностей, которые создают агенты. Настоящий выход — не в более дешевых token, а в коэволюции: «агентские фреймворки, которые потребляют меньше token» × «более мощные и более эффективные модели». Действия Anthropic — намеренно это или нет — подталкивают всю экосистему, и open source, и closed source, в этом направлении. Похоже, это хорошая новость.

По поводу взглядов Ло Фули разработческое сообщество отреагировало очень резко, и фокус обсуждения быстро сместился с «прав ли Anthropic» к нескольким более фундаментальным вопросам:

Это не спор о ценообразовании; это структурная переписка экономической модели AI.

Как сказала Ло Фули, единая себестоимость AI‑сервиса никогда не определяется одной только моделью — она складывается из «модели × фреймворка × контекст‑менеджмента». Действие Anthropic невольно создает давление естественного отбора на агентские фреймворки.

Кто‑то сформулировал еще прямее: реальный сигнал, который передает этот шаг Anthropic, такой — слой оркестрации является продуктом, а не только сама модель. Напряжение между подписочной моделью и оплатой через API — всего лишь поверхностное проявление более глубокой логики.

Не спешите ругать ценообразование — сначала посмотрите, как «сжигаются» вычислительные мощности.

«Расточительство вычислительных мощностей», о котором говорит Ло Фули, вызвало сильный отклик у людей из индустрии. Один человек сказал по делу: дело вообще не в том, что «AI слишком дорогой», а в том, что «вычислительные мощности тратят впустую» — грубый дизайн фреймворка плюс огромное окно контекста плюс ненужные избыточные вызовы — деньги сгорают, не давая никакого реального результата.

Более глубокое понимание пришло от одного разработчика: он указал, что решения о том, как в Claude Code обрабатывается контекст, никогда не являются вопросом «параметра по умолчанию», а представляют собой способность — после многократных раздумий о том, что сохранять, что выбрасывать и когда сжимать — встроить эту логичную инженерную оценку в архитектуру. У сторонних фреймворков дело не в отсутствии функций, а в отсутствии этой встроенной инженерной позиции.

Другой разработчик подтвердил это на собственном опыте: в прошлом месяце он потратил много времени, чтобы очистить избыточную логику в старом слое оркестрации, который он собирал для клиента; «чистить бардак оказалось гораздо тяжелее, чем когда его строили изначально».

Рыночное вытеснение уже началось, но финал не определен.

Ло Фули считает, что давление по затратам будет подталкивать фреймворки к эволюции, но разработчики подняли более жесткий вопрос: способны ли сторонние фреймворки достаточно быстро сократить разрыв по эффективности, чтобы цена через API оставалась экономически приемлемой? Или же большинство пользователей увидит, что стоимость слишком болезненная, и просто по умолчанию вернется к Claude Code?

Эти две дороги ведут к совершенно разным ландшафтам экосистемы. Один из разработчиков дополнил: разработчикам фреймворков на самом деле нужны не «права на подключение, включенные в комплект», а четкие и предсказуемые ограничения token‑квоты — ясные границы как раз стимулируют лучшее поведение продукта, а размытые «серые зоны» лишь порождают хаос.

Пост Ло Фули — это сигнал о весьма перспективной технической эволюции, и соответствующие обсуждения затронули ключевые болевые точки текущей AI‑инженерии ПО. Дальше посмотрим, как весь рынок перейдет от «грубого сжигания вычислительных мощностей» к «точной инженерной архитектуре».

Огромный поток информации и точная интерпретация — всё в приложении Sina Finance

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .