動察 Beating 監測によると、最近、Google AI 開発者フォーラムで Gemini API の課金システムの制御不能に関する緊急援助事例が複数報告された。複数の開発者が正常に使用している最中に、システムの底層の脆弱性により巨額の異常課金に直面している。例えば、ある人はわずか12時間で約2.7万元の人民币を引き落とされた。現在、Google の請求と技術チームはこの件について責任の押し付け合いを続けており、公式の修正声明や迅速な返金窓口は一切発表されていない。
調査によると、開発者に高額請求をもたらした主な2つのコアバグは次の通りである:一つは「幽霊キャッシュ」脆弱性であり、開発者が API を通じて作成したコンテキストキャッシュが期限切れまたは削除された後、フロントエンドの管理リストは空になっているにもかかわらず、Google のバックエンドは毎時間数千元の速度で「空回り」しながら課金を続けること。もう一つは「思考死循環」罠であり、ネット検索などのツールを有効にすると、モデルの「思考予算制限」が無効になり、モデルが単純なタスクを処理する際に無限推論に陥り、最大6.4万トークンを使い果たした後にタイムアウトしてクラッシュする。たとえ最終的に「ゼロ出力」(有用な回答を返さない)であっても、Googleは依然として思考コストの1500倍の暴騰した料金を全額請求している。
Google Cloud の課金システムには32時間から72時間の深刻な遅延が存在し、また自動的に制限を超えた場合に断続的に遮断する仕組みも欠如しているため、開発者は警報を受ける前に巨額の料金を引き落とされている。公式のカスタマーサポートの責任回避やフォーラムでの正面からの回答がないことから、財務リスクを回避するために、一部の被害者開発者は本番環境での Gemini のコンテキストキャッシュと推論モデルの完全廃止を宣言している。
Google Gemini APIが超高額な「幽霊請求」脆弱性を露呈:キャッシュ削除でも請求、出力ゼロでも課金
動察 Beating 監測によると、最近、Google AI 開発者フォーラムで Gemini API の課金システムの制御不能に関する緊急援助事例が複数報告された。複数の開発者が正常に使用している最中に、システムの底層の脆弱性により巨額の異常課金に直面している。例えば、ある人はわずか12時間で約2.7万元の人民币を引き落とされた。現在、Google の請求と技術チームはこの件について責任の押し付け合いを続けており、公式の修正声明や迅速な返金窓口は一切発表されていない。
調査によると、開発者に高額請求をもたらした主な2つのコアバグは次の通りである:一つは「幽霊キャッシュ」脆弱性であり、開発者が API を通じて作成したコンテキストキャッシュが期限切れまたは削除された後、フロントエンドの管理リストは空になっているにもかかわらず、Google のバックエンドは毎時間数千元の速度で「空回り」しながら課金を続けること。もう一つは「思考死循環」罠であり、ネット検索などのツールを有効にすると、モデルの「思考予算制限」が無効になり、モデルが単純なタスクを処理する際に無限推論に陥り、最大6.4万トークンを使い果たした後にタイムアウトしてクラッシュする。たとえ最終的に「ゼロ出力」(有用な回答を返さない)であっても、Googleは依然として思考コストの1500倍の暴騰した料金を全額請求している。
Google Cloud の課金システムには32時間から72時間の深刻な遅延が存在し、また自動的に制限を超えた場合に断続的に遮断する仕組みも欠如しているため、開発者は警報を受ける前に巨額の料金を引き落とされている。公式のカスタマーサポートの責任回避やフォーラムでの正面からの回答がないことから、財務リスクを回避するために、一部の被害者開発者は本番環境での Gemini のコンテキストキャッシュと推論モデルの完全廃止を宣言している。