Google Gemini API обнаружена «уязвимость в системе оплаты за кэш», разработчики удалили неактивные и были оштрафованы на 20 000 реалов

Google AI разработчикский форум недавно сообщил о серьезной аварии с аномальными счетами за API. Один разработчик опубликовал сообщение с просьбой о помощи, указав, что функция кэширования текста Gemini 3 Flash (Context Caching), используемая им, при удалении через API на фронтенде продолжает начислять счета на бекенде с ошеломляющей скоростью более тысячи юаней в час, а за несколько дней накопительный счет достиг почти 20 тысяч бразильских реалов (около нескольких тысяч долларов). В настоящее время этот разработчик был вынужден полностью отключить сервис Gemini API, чтобы остановить убытки, и этот инцидент вызвал высокий интерес в сообществе разработчиков.
(Предыстория: Трамп заявил о вложениях в американские AI-компании, планируется на этой неделе обсудить с OpenAI, Anthropic, xAI, Altman предложил концепцию «фонда общественного богатства»)
(Дополнительный фон: Перед IPO SpaceX объявила крупную сделку: Google платит 920 миллионов долларов в месяц за аренду 110 тысяч GPU NVIDIA)

Содержание статьи

Переключить

  • Удаление кэша не прекращает списания! В час — тысячи юаней
  • Срочно отключить API для остановки потока убытков, официальные исправления пока не предоставлены
  • Сообщество разработчиков в панике, использование функции кэширования требует осторожности

Скрытые расходы на API больших моделей искусственного интеллекта всегда были острым вопросом для разработчиков, и недавно API Gemini от Google внезапно столкнулся с пугающей уязвимостью «призрачных» счетов. На форуме Google AI разработчиков появилась публикация с заголовком «Экстренно: огромная проблема увеличения стоимости кэша (вторая часть)», которая раскрывает, что служба кэширования Gemini 3 Flash (Context Caching) на бэкенде, по всей видимости, вышла из-под контроля в механизме начислений.

Удаление кэша не прекращает списания! В час — тысячи юаней

По данным подробных счетов BigQuery, предоставленных разработчиком Danilo_Oliveira, инцидент начался 3 июня 2026 года. Изначально стоимость хранения «токенов кэша текста» (SKU ID: 583D-5DB6-4555) составляла около 20-30 бразильских реалов (BRL) в час, при использовании примерно 4 миллиона токенов в час.

Однако к 6 июня ситуация резко ухудшилась, и расходы начали расти экспоненциально. За один час использование превысило 200 миллионов токенов, а списания достигали более 1000 бразильских реалов в час. К утру 7 июня сумма аномальных списаний достигла 341 раза, а общий счет вырос до 17 847,21 бразильского реалов, что свидетельствует о полном выходе системы из-под контроля.

Срочно отключить API для остановки потока убытков

Столкнувшись с растущими огромными счетами, разработчик принял все возможные меры предосторожности. Он немедленно отключил скрипты, создающие кэш, и через официальный REST API Google проверил, что список кэша на фронтенде полностью очищен. Однако, что было особенно шокирующим, — даже после отображения отсутствия кэша на фронтенде, система на бекенде продолжала без ограничений списывать деньги.

Подозревая, что это баг, связанный с неправильным удалением записей кэша на сервере Google, разработчик срочно создал тикет #720261 о проблеме счета и попытался договориться с поддержкой. Чтобы остановить рост финансовой «черной дыры», он был вынужден полностью отключить весь сервис Gemini API в проекте Google Cloud.

Сообщество разработчиков в панике, использование функции кэширования требует осторожности

После публикации инцидента на форуме, он быстро вызвал волну обсуждений среди коллег. Изначально функция кэширования (Context Caching) предназначалась для решения проблем стоимости и задержек при обработке длинных текстов большими языковыми моделями (LLM), но теперь она стала «черной дырой» для денег, что безусловно вызывает тревогу у компаний и индивидуальных разработчиков, планирующих масштабное внедрение Gemini API.

Пока Google не исправит и не объяснит этот бэкэнд-уязвимость официально, сообщество настоятельно рекомендует разработчикам, использующим функцию кэширования Gemini API, внимательно следить за текущими счетами в Google Cloud, устанавливать строгие лимиты бюджета и системы оповещений, чтобы не проснуться однажды с неподъемными счетами.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено