Google AI 開発者フォーラムで最近、深刻なAPI請求異常の災害が報告された。 ある開発者が救援を求める投稿を行い、彼が使用しているGemini 3 Flashテキストキャッシュ(Context Caching)機能において、フロントエンドでAPIを削除・クリアした後も、バックエンド側で毎時千円を超える驚くべき速度で請求が継続されていると指摘し、数日で請求額が2万ブラジルレアル(約数千ドル)に迫っている。 現在、その開発者は止血のためにGemini APIサービスを全面停止せざるを得なくなっており、この事件は開発者コミュニティで大きな関心を呼んでいる。 (前提:トランプ氏が米国AI企業への出資を呼びかけ、今週中にもOpenAI、Anthropic、xAIと協議予定、Altmanは「公共財富基金」構想を提案) (補足:SpaceX IPO前の公開大口契約:Googleは月額9億2000万ドルをNVIDIA GPU計算資源に支払う)
この記事の目次
Toggle
人工知能大規模モデルAPIの隠れたコストは、常に開発者の高い関心事だったが、Google傘下の最新Gemini APIにおいて、最近「幽霊請求」バグと呼ばれる驚くべき脆弱性が明らかになった。 Google AI開発者フォーラムに、「緊急:巨大なキャッシュコスト増加問題(第2弾)」と題した救援投稿があり、Gemini 3 Flashキャッシュサービス(Context Caching)のバックエンド請求メカニズムに深刻な制御不能の疑いが浮上している。
開発者Danilo_Oliveiraが提供した詳細なBigQuery請求データによると、この異常事象は2026年6月3日に始まった。 最初は、Gemini 3 Flashの「キャッシュテキスト保存トークン時間(SKU ID: 583D-5DB6-4555)」の費用が1時間あたり約20〜30ブラジルレアル(BRL)で推移し、使用量は約400万トークン時間だった。
しかし、6月6日になると状況は一気に悪化し、費用は爆発的な指数関数的増加を示した。 単一の時間での使用量はなんと2億トークン時間を突破し、1時間あたりの請求額は1000ブラジルレアル以上に達した。 6月7日未明までに、341回の異常請求が積み重なり、請求総額は17,847.21ブラジルレアルに膨れ上がり、請求システムが完全に制御不能になっていることを示している。
この巨大な請求額に直面し、該当開発者はあらゆる対策を講じた。 キャッシュを生成するスクリプトを即座に停止し、Google公式のREST APIを通じてキャッシュリストが「完全に空になった」ことを確認した。 しかし、フロントエンドでキャッシュがなくなったと表示されているにもかかわらず、バックエンドシステムは依然として無制限に請求を続けていることに、開発者は絶望した。
Googleのバックエンドサーバーがキャッシュ記録を正しくクリアできなかったバグが原因と疑い、開発者は緊急で請求問題の工番#720261のサポートチケットを開き、公式と交渉を試みている。 財務のブラックホール拡大を防ぐため、最終的には「玉石共焚」の決断を下し、Google Cloudのプロジェクト内でGemini API全体を完全停止した。
この事件はフォーラムで公開されると、瞬く間に業界の関心と議論を呼び起こした。 キャッシュ機能(Context Caching)は、大規模言語モデル(LLM)が長大なテキスト処理時のコストと遅延を解決するために設計されたものだが、今や資金を飲み込むブラックホールと化してしまった。 これは、Gemini APIを大規模導入しようとしている企業や個人開発者にとって、冷水を浴びせる出来事となった。
Google公式がこのバックエンドの脆弱性を修復し、公開して説明するまでは、コミュニティは現在Gemini APIのキャッシュ機能を使用している開発者に対し、Google Cloudのリアルタイム請求を監視し、厳格な予算上限とアラート設定を行うことを強く推奨している。 一度目覚めたら、膨大な請求に耐えられなくなる可能性があるためだ。
3.71M 人気度
499.12M 人気度
56.35K 人気度
1.35M 人気度
1.81M 人気度
Google Gemini API が「キャッシュ課金の脆弱性」を暴露、開発者が無効削除で2万レアルの過剰請求を受ける
Google AI 開発者フォーラムで最近、深刻なAPI請求異常の災害が報告された。
ある開発者が救援を求める投稿を行い、彼が使用しているGemini 3 Flashテキストキャッシュ(Context Caching)機能において、フロントエンドでAPIを削除・クリアした後も、バックエンド側で毎時千円を超える驚くべき速度で請求が継続されていると指摘し、数日で請求額が2万ブラジルレアル(約数千ドル)に迫っている。
現在、その開発者は止血のためにGemini APIサービスを全面停止せざるを得なくなっており、この事件は開発者コミュニティで大きな関心を呼んでいる。
(前提:トランプ氏が米国AI企業への出資を呼びかけ、今週中にもOpenAI、Anthropic、xAIと協議予定、Altmanは「公共財富基金」構想を提案)
(補足:SpaceX IPO前の公開大口契約:Googleは月額9億2000万ドルをNVIDIA GPU計算資源に支払う)
この記事の目次
Toggle
人工知能大規模モデルAPIの隠れたコストは、常に開発者の高い関心事だったが、Google傘下の最新Gemini APIにおいて、最近「幽霊請求」バグと呼ばれる驚くべき脆弱性が明らかになった。
Google AI開発者フォーラムに、「緊急:巨大なキャッシュコスト増加問題(第2弾)」と題した救援投稿があり、Gemini 3 Flashキャッシュサービス(Context Caching)のバックエンド請求メカニズムに深刻な制御不能の疑いが浮上している。
キャッシュ削除後も請求継続!1時間で千円超
開発者Danilo_Oliveiraが提供した詳細なBigQuery請求データによると、この異常事象は2026年6月3日に始まった。
最初は、Gemini 3 Flashの「キャッシュテキスト保存トークン時間(SKU ID: 583D-5DB6-4555)」の費用が1時間あたり約20〜30ブラジルレアル(BRL)で推移し、使用量は約400万トークン時間だった。
しかし、6月6日になると状況は一気に悪化し、費用は爆発的な指数関数的増加を示した。
単一の時間での使用量はなんと2億トークン時間を突破し、1時間あたりの請求額は1000ブラジルレアル以上に達した。
6月7日未明までに、341回の異常請求が積み重なり、請求総額は17,847.21ブラジルレアルに膨れ上がり、請求システムが完全に制御不能になっていることを示している。
緊急API停止で止血、公式修復未発表
この巨大な請求額に直面し、該当開発者はあらゆる対策を講じた。
キャッシュを生成するスクリプトを即座に停止し、Google公式のREST APIを通じてキャッシュリストが「完全に空になった」ことを確認した。
しかし、フロントエンドでキャッシュがなくなったと表示されているにもかかわらず、バックエンドシステムは依然として無制限に請求を続けていることに、開発者は絶望した。
Googleのバックエンドサーバーがキャッシュ記録を正しくクリアできなかったバグが原因と疑い、開発者は緊急で請求問題の工番#720261のサポートチケットを開き、公式と交渉を試みている。
財務のブラックホール拡大を防ぐため、最終的には「玉石共焚」の決断を下し、Google Cloudのプロジェクト内でGemini API全体を完全停止した。
開発者コミュニティのパニック、キャッシュ機能使用は慎重に
この事件はフォーラムで公開されると、瞬く間に業界の関心と議論を呼び起こした。
キャッシュ機能(Context Caching)は、大規模言語モデル(LLM)が長大なテキスト処理時のコストと遅延を解決するために設計されたものだが、今や資金を飲み込むブラックホールと化してしまった。
これは、Gemini APIを大規模導入しようとしている企業や個人開発者にとって、冷水を浴びせる出来事となった。
Google公式がこのバックエンドの脆弱性を修復し、公開して説明するまでは、コミュニティは現在Gemini APIのキャッシュ機能を使用している開発者に対し、Google Cloudのリアルタイム請求を監視し、厳格な予算上限とアラート設定を行うことを強く推奨している。
一度目覚めたら、膨大な請求に耐えられなくなる可能性があるためだ。