Роулфлі: Заборона підписки Claude на Лобстер — справжній вихід не у ще дешевших токенах

robot
Генерація анотацій у процесі

(Джерело: Машина розуму)

Редакція «Машини розуму»

В епоху агентів нам потрібні правильна система виставлення рахунків і філософія інженерного проєктування. Саме такий погляд щойно висловив на X керівник великомасштабної мовної моделі Xiaomi MiMo Ло Фулілі.

Кілька днів тому ми повідомляли новину — Anthropic оголосила, що від сьогодні користувачам Claude Pro та Max не можна більше витрачати ліміти підписки на сторонні агентські фреймворки на кшталт OpenClaw. Хочете й далі користуватися? Тоді треба перейти на API з оплатою за використання. Це миттєво спантеличило багатьох користувачів Claude, які «грали в “лобстера”» за підписковою моделлю.

Офіційне пояснення Anthropic таке: підпискова модель ціноутворення була розрахована на «звичайну інтенсивність використання персональними користувачами», однак використання автоматизованих агентських інструментів на кшталт OpenClaw значно перевищує очікування — важкі користувачі щомісяця платять лише 200 доларів за підписку, але споживають обчислювальні ресурси на 5000 доларів, створюючи Anthropic величезний тиск витрат.

Після появи новини реакції з різних боків були неоднакові: хтось кричав «вдарили ножем у спину», вважаючи, що підпискова модель раптом втратила привабливість; а хтось аплодував, вважаючи, що це очищення неефективного використання й захисту сталості всієї платформи.

Якою б не була позиція, на поверхню вийшло ключове питання: теперішня модель оплати за токени вже надто складно справляється з викликами — нам потрібні розумніші, більш сталі способи використання обчислювальних потужностей.

У дописі Ло Фулілі спершу зазначила, що підпискова модель Anthropic по суті працює в мінус.

Підпискова модель Claude Code — це збалансована система розподілу обчислювальних потужностей із дуже продуманим дизайном. Моя оцінка така — імовірно, вона не приносить прибутку, а може навіть бути збитковою, якщо тільки їхня маржа від API не в 10–20 разів вища, але я в цьому сумніваюся. Я не можу точно порахувати, наскільки великими були втрати через підключення сторонніх фреймворків, але я близько бачив context-менеджмент OpenClaw — він написаний дуже погано. У межах одного запиту користувача він запускає кілька раундів інструментальних викликів низької цінності, кожен із них відправляється як окремий API-запит і щоразу несе дуже довге вікно контексту (часто понад 100 тис. токенів). Навіть якщо кеш спрацьовує, це вкрай марнотратно; у крайніх випадках це ще й підвищує частоту помилок кешу в інших запитах.

У перерахунку виходить, що кількість API-викликів, яку фактично тригерить один запит користувача, у кілька разів більша за кількість у власному фреймворку Claude Code. Якщо перевести це на ціни API, реальна вартість приблизно в десятки разів вища за ціну підписки. Це не просто різниця — це пастка.

Щодо болю, який відчують користувачі, яких зараз відрізали від підписки, вона вважає, що цей біль у довгостроковій перспективі матиме користь — змусить до прогресу в інженерії.

OpenClaw, OpenCode та подібні сторонні фреймворки все ще можуть викликати Claude через API, але вже не можна буде «їздити зайцем» на підписці. У короткостроковій перспективі цим агентним користувачам буде дуже боляче — витрати легко стрибнуть у десятки разів. Але саме цей тиск і є стимулом для таких фреймворків по-справжньому покращити менеджмент context, максимізувати частоту попадань у кеш prompt, щоб повторно використовувати вже опрацьований контекст, і скоротити витрати на марні токени. Болісний період зрештою перетвориться на інженерну дисципліну.

Також вона випускає застереження: не дозволяйте компаніям, що працюють із великими моделями, сліпо вести цінові війни; дешевий продаж Token, але потурання третім сторонам у «викачуванні» ресурсів через інструменти, — це пастка.

Я хочу застерегти виробників великих мовних моделей: поки ви не продумали, як призначати ціни на підписку для coding, і щоб це не призвело до великого перевитрачання, не варто бездумно знижувати ціну до дна. Продати токени надзвичайно дешево, одночасно відчиняючи двері для сторонніх фреймворків — на поверхні це ніби дружньо для користувачів, але насправді це пастка. Anthropic щойно вибралася з цієї пастки. Глибша проблема в тому, що якщо користувач витрачає час і зусилля на агентські фреймворки низької якості, на вкрай нестабільні й повільні сервіси для міркувань, на моделі, які «усохли» заради зниження витрат, то врешті виявляється, що все одно нічого не вийшло — і це формує порочне коло для користувацького досвіду та утримання.

Далі вона також розповідає про нещодавно запущений Xiaomi MiMo Token Plan і підкреслює, що вони «прагнуть довгостроково стабільно постачати високоякісні моделі та сервіси».

Щодо MiMo Token Plan — він підтримує підключення сторонніх фреймворків, оплата здійснюється за токенним квотуванням; логіка така сама, як і в нещодавно представленому Claude extra usage. Бо ми прагнемо довгостроково стабільно постачати високоякісні моделі та сервіси — а не щоб ви імпульсивно заплатили, а потім відпливли геть.

Наприкінці вона вказує, що нині пропозиція обчислювальних потужностей у всьому світі вже не встигає за потребами в токенах, які генерують агенти. Справжній шлях — не в дешевших токенах, а в узгодженій еволюції — «агентські фреймворки, що використовують менше токенів» × «більш потужні, більш ефективні моделі». Дії Anthropic цього разу — незалежно від того, чи була в цьому цілеспрямованість — штовхають всю екосистему, і відкриту, і закриту, у цьому напрямку. Мабуть, це хороша справа.

На погляди Ло Фулілі відреагувала розробницька спільнота, і фокус обговорень швидко змістився з «чи правильні дії Anthropic» на кілька більш фундаментальних питань:

1、Це не суперечка про ціноутворення, а структурний перезапис AI-економіки.

Як сказала Ло Фулілі, собівартість одиниці витрат в AI-сервісах ніколи не визначається лише самою моделлю — вона складається з трьох факторів: «модель × фреймворк × менеджмент context». Дії Anthropic цього разу ненавмисно створили тиск природного добору на агентські фреймворки.

Хтось сказав ще пряміше: справжній сигнал, який передає вчинок Anthropic, такий — шар оркестрації є продуктом, а не лише сама модель. Напруження між підписковою моделлю та оплатою через API — це лише поверхневий симптом цієї глибшої логіки.

2、Не поспішайте лаяти ціни — спершу подивіться, як згоряють обчислювальні потужності.

«Марнотратство обчислювальних потужностей», про яке говорить Ло Фулілі, знайшло сильний відгук у людей із цієї сфери. Хтось влучно підмітив: це взагалі не проблема «занадто дорогого AI», а проблема «втрати обчислювальних потужностей» — грубий дизайн фреймворків плюс величезні вікна контексту плюс непотрібні надмірні виклики спалюють гроші, не даючи жодного реального результату.

Більш глибоке розуміння прийшло від одного розробника: він вказав, що рішення щодо context у Claude Code — це ніколи не «параметр за замовчуванням», а напрацьоване в архітектурі судження, що багато разів обдумувалося: що зберігати, що викидати, і коли стискати. Те, чого бракує стороннім фреймворкам, — це не функціональність, а така вбудована інженерна думка.

Інший розробник підкріпив це власним досвідом: він минулого місяця витратив багато часу на очищення надлишкової логіки в старому шарі оркестрації, яку він збирав для клієнтів; «чистка безладу коштує більше зусиль, ніж коли його збирали спочатку».

3、Відбір на ринку вже почався, але фінал не визначений.

Ло Фулілі вважає, що тиск витрат підштовхне еволюцію фреймворків, але розробники поставили більш жорстке запитання: чи зможуть сторонні фреймворки достатньо швидко компенсувати різницю в ефективності, щоб ціноутворення API все ще залишалося економічно виправданим? Або більшість користувачів виявить, що витрати надто жахливі, і просто повернеться за замовчуванням до Claude Code?

Ці два шляхи ведуть до різко різних конфігурацій екосистеми. Один із розробників додав: те, що справді потрібно розробникам фреймворків, — не «право на підключення включено в пакет», а чіткі й передбачувані обмеження token-квот — зрозумілі межі лише стимулюють кращу поведінку продукту, а розмиті «сірі зони» спричинять хаос.

Допис Ло Фулілі — це дуже сигналізуючий наперед сигнал про технічну еволюцію; і пов’язані обговорення влучили в одну з ключових больових точок сучасної AI-інженерії. Далі лишається побачити, як весь ринок перейде від «грубої витрати обчислювальних потужностей» до «точної інженерної архітектури».

Дуже багато новин і точна інтерпретація — усе в застосунку Sina Finance APP

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Популярні активності Gate Fun

    Дізнатися більше
  • Рин. кап.:$2.24KХолдери:1
    0.00%
  • Рин. кап.:$2.24KХолдери:1
    0.00%
  • Рин. кап.:$2.24KХолдери:1
    0.00%
  • Рин. кап.:$2.59KХолдери:2
    2.65%
  • Рин. кап.:$2.25KХолдери:1
    0.00%
  • Закріпити