Google Gemini API виявила «уразливість у обліку кешу», розробники видалили недійсні дані і були різко списані 20 000 лір

Google AI розробницький форум нещодавно повідомив про серйозну аварію з аномальним списанням API. Один з розробників опублікував повідомлення з проханням про допомогу, вказуючи, що функція кешування тексту Gemini 3 Flash (Context Caching), яку він використовує, після видалення через API на фронтенді продовжує безперервно списувати кошти з бекенду з приголомшливою швидкістю понад тисячу юанів за годину, а за кілька днів рахунок наблизився до 20 тисяч бразильських реалів (приблизно кілька тисяч доларів США). Наразі цей розробник був змушений повністю припинити використання сервісу Gemini API, щоб зупинити витоки, і ця подія викликала високий інтерес у спільноті розробників.
(Передісторія: Трамп оголосив про інвестиції у американські AI-компанії, найближчим часом планує обговорення з OpenAI, Anthropic, xAI, а Альтман пропонує концепцію «фонду громадського багатства»)
(Додатковий фон: Перед IPO SpaceX оголосила великі замовлення: Google щомісяця платить 920 мільйонів доларів за оренду 110 тисяч GPU NVIDIA)

Зміст статті

Перемикач

  • Навіть після видалення кешу списання триває! За годину — тисяча юанів
  • Екстрене припинення API для зупинки витоків, офіційна команда ще не надала рішення
  • Спільнота розробників у паніці, використання функції кешування вимагає обережності

Приховані витрати API великих моделей штучного інтелекту завжди були болючою точкою для розробників, але нещодавній випадок з Gemini API від Google викликав справжній шок через появу «привидового» багу з несподіваним списанням коштів. На форумі Google AI розробників з’явилася публікація з назвою «Терміново: велика проблема з додатковими витратами на кешування (друге повідомлення)», яка розкрила, що сервіс кешування Gemini 3 Flash (Context Caching) у механізмі оплати за послуги, ймовірно, вийшов з-під контролю.

Навіть після видалення кешу списання триває! За годину — тисяча юанів

Згідно з детальними даними рахунків BigQuery, наданими розробником Danilo_Oliveira, ця аномалія почалася 3 червня 2026 року. Спочатку вартість «кешування тексту» (Token Storage per Hour, SKU ID: 583D-5DB6-4555) для Gemini 3 Flash трималася на рівні приблизно 20-30 бразильських реалів (BRL) за годину, з обсягом близько 4 мільйонів Token-годин.

Однак уже 6 червня ситуація різко погіршилася, і вартість почала зростати експоненційно. За один годинний період використання кількість Token-годин перевищила 200 мільйонів, а списання сягнуло понад 1 000 бразильських реалів за годину. До ранку 7 червня загальна кількість аномальних списань сягнула 341, і сума рахунку підскочила до 17 847,21 бразильського реалу, що свідчить про повний вихід системи з-під контролю.

Екстрене припинення API для зупинки витоків, офіційна команда ще не надала рішення

Зі зростанням величезних рахунків, що нагадують сніжний ком, цей розробник застосував усі можливі заходи. Він негайно закрив скрипти, що генерували кеш, і за допомогою офіційного REST API Google перевірив, що список кешів на фронтенді був «повністю очищений». Однак, що ще більш шокуюче, навіть коли фронтенд показував відсутність кешу, бекенд системи продовжував безконтрольно списувати кошти.

Через підозру, що проблема виникла через баг у неправильному очищенні кешу на сервері Google, розробник терміново відкрив заявку #720261 щодо проблеми з рахунками і намагався домовитися з офіційною підтримкою. Щоб запобігти подальшому зростанню фінансової дірки, він був змушений застосувати крайній захід — повністю відключити весь сервіс Gemini API у проекті Google Cloud.

Спільнота розробників у паніці, використання функції кешування вимагає обережності

Після публікації цієї історії на форумі вона швидко привернула увагу та обговорення серед колег. Оскільки функція кешування (Context Caching) спочатку була задумана для зменшення витрат і затримок при обробці довгих текстів великими мовними моделями (LLM), тепер вона стала «чорною дірою», яка поглинає кошти, що викликає холодний душ для компаній і приватних розробників, які готуються масштабно використовувати Gemini API.

Поки офіційне виправлення та публічне пояснення цієї бекенд-уразливості не з’явилися, спільнота наполегливо рекомендує всім, хто використовує функцію кешування в Gemini API, уважно стежити за актуальним рахунком у Google Cloud, встановлювати суворі ліміти бюджету та системи оповіщень, щоб уникнути несподіваного зростання витрат і потрапляння у фінансову прірву.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено