Anthropic відповідає на кризу обмежень Claude Code: рекомендує не використовувати Opus і закрити контекст близько 1 мільйона, не згадуючи про компенсацію

robot
Генерація анотацій у процесі

За моніторингом 1M AI News, учасниця команди Anthropic Claude Code Лідія Галлі опублікувала результати розслідування щодо суперечок навколо обмежень за останні два тижні. Висновок такий: у пікові години ліміти справді було затягнуто, витрати в сеансах контексту на 1 мільйон token зросли, «саме це є більшою частиною причин, які ви відчуваєте». Вона зазначила, що команда виправила деякі bug, але підкреслила, що «жоден bug не призвів до переплати».

Після цього вона навела рекомендації щодо економії:

  1. Для Pro користувачів за замовчуванням використовувати Sonnet 4.6 замість Opus, тому що Opus споживає приблизно вдвічі швидше
  2. Якщо немає потреби в глибоких міркуваннях, знизити інтенсивність міркувань або вимкнути extended thinking
  3. Довгі сеанси, що простоюють понад годину, не відновлювати — починати новий
  4. Встановити змінну середовища CLAUDE_CODE_AUTO_COMPACT_WINDOW=200000, щоб обмежити розмір вікна контексту

Не було згадано жодних форм скидання лімітів або компенсації.

Ведучий AI-подкасту Алекс Волков підсумував цю відповідь як «ви тримаєте це не так» (You’re holding it wrong), вказавши, що Anthropic сама встановила 1 мільйон контексту як налаштування за замовчуванням, а Opus — як флагманську модель, але тепер радить платним користувачам не використовувати ці функції. Він також зазначив, що на відміну від OpenAI Codex, який раніше зіткнувся з подібною проблемою та скидав користувачам квоти, Anthropic не зробила жодної ретроспективної компенсації.

Твердження про «без переплати» також суперечить власним записам оновлень Claude Code. Того ж дня, напередодні, версія v2.1.90, опублікована за день до цього, виправила bug регресії кешу, який існував з v2.1.69: під час відновлення сеансу за допомогою --resume запити, що мали б потрапити в кеш, натомість спричиняють повний prompt cache miss і виставляються за повною ціною. Цей bug охопив приблизно 20 версій, перш ніж його виявили та виправили. У відповіді Лідії не було згадано про цей підтверджений аномальний випадок виставлення рахунків.

З 23 березня багато Pro та Max підписників повідомляли, що ліміти аномально швидко вичерпуються. GitHub issue #41930 зібрав сотні повідомлень: дехто заявляв, що квота для плану Max 5x закінчилась за 1 годину; інші — що одна проста однострокова відповідь довела рівень використання з 59% до 100%. 30 березня Anthropic у Reddit визнавав «швидкість, з якою користувачі досягають лімітів, значно перевищує очікування», і зазначав, що це вже внесено до переліку найвищих пріоритетів для команди.

Головна проблема цієї відповіді не в тому, чи є технічні деталі точними, а в тому, що вона практично всю відповідальність перекладає на спосіб використання користувачами. Anthropic продає підписки Pro/Max на «найпотужнішу модель + найбільший контекст + найвищу здатність до міркувань», беручи від 20 до 200 доларів на місяць, а тепер каже користувачам економити.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Популярні активності Gate Fun

    Дізнатися більше
  • Рин. кап.:$2.23KХолдери:1
    0.00%
  • Рин. кап.:$2.23KХолдери:0
    0.00%
  • Рин. кап.:$2.24KХолдери:2
    0.24%
  • Рин. кап.:$2.23KХолдери:2
    0.00%
  • Рин. кап.:$2.22KХолдери:1
    0.00%
  • Закріпити