Зворотній аналіз Claude Code виявив дві помилки кешування, які можуть безшумно збільшити вартість API в 10-20 разів

robot
Генерація анотацій у процесі

Повідомлення з CoinDesk, за даними моніторингу 1M AI News: один розробник за допомогою Ghidra, MITM-проксі та radare2 виконав реверсний інжиніринг незалежно встановлюваної версії Claude Code і розібрав бінарний файл обсягом 228 МБ. Він виявив два окремі кеш-помилки (Bug), які можуть непомітно для користувача підвищувати API-витрати у 10–20 разів. Відповідний аналіз подано на GitHub (issue #40524); Anthropic позначила це як регресійну помилку і призначила для опрацювання. Перша помилка знаходиться у спеціально налаштованому runtime Bun, який використовується в незалежно встановлюваній версії. Кожного разу під час запиту до API runtime шукає ідентифікатор для тарифікації в тілі запиту та виконує заміну, але логіка заміни потрапляє на перший збіг у тілі запиту. Якщо історія діалогу містить цей рядок (наприклад, під час обговорення внутрішнього механізму тарифікації в Claude Code), заміна потрапляє в текст повідомлення, а не в системний промпт, що призводить до того, що кожен запит запускає повне повторне відновлення кешу. Тимчасовий спосіб обійти проблему — перейти на запуск через npx @anthropic-ai/claude-code; версія npm-пакета не містить цієї логіки заміни. Друга помилка впливає на всіх користувачів, які відновлюють сесію за допомогою --resume або --continue, і була введена починаючи з v2.1.69. Під час відновлення сесії місце, куди здійснюється ін’єкція додаткової інформації системою, відрізняється від того, коли створюється нова сесія, через що префікс кешу повністю не збігається: увесь попередній історичний сегмент діалогу зчитується з кешу вже як не має, а натомість відбувається повний перезапис. Наступні раунди відновлення працюють нормально, але сама операція відновлення вже спричинила значні додаткові витрати; наразі немає зовнішнього обхідного рішення. Розробник оцінив, що для довгого діалогу приблизно на 500 тис. token Bug 1 щоразу додатково споживає близько $0.04, Bug 2 щоразу додатково споживає $0.15; у сумі сукупна вартість одного запиту може перевищити $0.20. Раніше інженер Anthropic Lydia Hallie підтвердила, що швидкість, з якою користувачі досягають обмеження за використанням, «значно швидша, ніж очікувалося». У коментарях на Reddit кілька користувачів вважають, що ці дві кеш-помилки можуть бути однією з ключових причин ненормального споживання ліміту.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити