Інженер Anthropic вибачився: насмішка над прогнозом "оплати за обчислювальну потужність AI" — моя помилка

robot
Генерація анотацій у процесі

Подсумок події

Інженер компанії Anthropic публічно вибачився, що раніше сміявся з твердження, що “обчислювальна потужність ШІ врешті-решт буде оплачуватись за використанням”. Він пояснив, що розширення дійсно складне, і що теперішні ціни та обмеження є вимушеним вибором, а не бажанням обманути.

Конкретна ситуація

  • Особа: Thariq Shihipar (@trq212), займається Claude Agent SDK
  • Він у відповіді на @weswinder сказав, що не слід було сміятися з оцінки @Pranit про те, що “обчислювальна потужність ШІ буде оплачуватись як комунальні послуги”
  • Його позиція: немає обману, проблема в тому, що розширення дійсно важке, а теперішня практика є “найкращим варіантом, що спало на думку”
  • Причина суперечки: @Pranit критикував тарифну систему Anthropic (є тариф на 200 доларів на місяць), що викликало обговорення витрат на інфраструктуру ШІ
  • Галузевий контекст: Cursor також часто стикається з обмеженнями швидкості в години пік, постійно працюючи над оптимізацією ефективності

Що це означає: Інженер першої лінії визнав проблему, про яку користувачі скаржилися протягом тривалого часу — розширення системи Agent дійсно важке, компанія все ще шукає баланс між витратами, продуктивністю та доступністю.

Чому це має сенс

  • Shihipar безпосередньо брав участь у розробці функцій Claude Subagent, циклічної перевірки тощо, він говорить з власного досвіду, а не з припущень
  • @Pranit вказує, що незалежно від тарифної системи Anthropic чи API-пулу Cursor Pro/Ultra+, в суті вони вже наближаються до “оплати за використання” — через великі коливання витрат на інференцію. Це те саме, що й дискусія 2026 року про витрати на обчислювальну потужність робочих потоків Agent
  • Основна суперечність полягає в тому, що:
    • Завдання стають все складнішими (переписування коду, багатоступенева інференція)
    • Виробники повинні знаходити баланс між ефективністю та можливостями, в години пік доводиться обмежувати швидкість
    • Деякі трюки на рівні SDK (наприклад, поступове звільнення контексту) можуть полегшити проблему, але не вирішують її корінь
  • Тарифна система та коригування лімітів Cursor також відображають ту ж саму проблему — активні користувачі мають великий попит на інференцію, швидко вичерпуючи свої ліміти

Оцінка впливу

  • Важливість: середня
    • Чому варто звернути увагу: Це технічна перспектива з першої лінії розробки, яка підтверджує реальну складність розширення Agent. Має цінність для розробників та технічних команд при виборі технологій та плануванні архітектури.

Підсумок

  • Основні висновки:

    1. Складність розширення є основною причиною: теперішні ціни та обмеження є компромісом в інженерній реальності, а не навмисним введенням в оману
    2. Оплата наближається до моделі за використанням: витрати та попит сильно коливаються, і важко уникнути тарифікації за рівнями + пулінга
    3. Обмеження швидкості в години пік є симптомом, а не першопричиною: основна проблема полягає в тому, що витрати ресурсів складних робочих потоків Agent важко прогнозувати
    4. Інструменти можуть полегшити, але не вирішити корінь: такі трюки, як поступове звільнення контексту, можуть допомогти, але конфлікт між продуктивністю та витратами залишається
  • Рекомендації для різних осіб:

    • Розробники/архітектори:
      • Резервуйте ліміти, розробіть плани зниження
      • Зосередьтеся на інструментах ефективності SDK (субагенти, циклічна перевірка, скорочення контексту)
    • Продукти та закупівлі:
      • Оцінюйте реальні доступні часові вікна для “тарифікації за рівнями + обмеження”
      • Зверніть увагу на рівень обслуговування та коливання досвіду в години пік
    • Відкритий код/екосистема інструментів:
      • Робіть різницю в прозорості витрат та управлінні ресурсами

Оцінка: Тенденція “оплати за використання обчислювальної потужності ШІ” наразі все ще на ранній стадії. Найбільше виграють розробники та технічні команди підприємств, які прагнуть стабільності та контролю витрат. Поки проблема розширення не буде вирішена, той, хто зможе ефективно управляти ресурсами, стратегіями обмеження та оптимізацією робочих потоків, отримає перевагу.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Популярні активності Gate Fun

    Дізнатися більше
  • Рин. кап.:$2.4KХолдери:2
    0.73%
  • Рин. кап.:$2.27KХолдери:2
    0.00%
  • Рин. кап.:$2.33KХолдери:2
    0.00%
  • Рин. кап.:$2.24KХолдери:1
    0.00%
  • Рин. кап.:$2.24KХолдери:1
    0.00%
  • Закріпити