Dasar
Spot
Perdagangkan kripto dengan bebas
Perdagangan Margin
Perbesar keuntungan Anda dengan leverage
Konversi & Investasi Otomatis
0 Fees
Perdagangkan dalam ukuran berapa pun tanpa biaya dan tanpa slippage
ETF
Dapatkan eksposur ke posisi leverage dengan mudah
Perdagangan Pre-Market
Perdagangkan token baru sebelum listing
Futures
Akses ribuan kontrak perpetual
CFD
Emas
Satu platform aset tradisional global
Opsi
Hot
Perdagangkan Opsi Vanilla ala Eropa
Akun Terpadu
Memaksimalkan efisiensi modal Anda
Perdagangan Demo
Pengantar tentang Perdagangan Futures
Bersiap untuk perdagangan futures Anda
Acara Futures
Gabung acara & dapatkan hadiah
Perdagangan Demo
Gunakan dana virtual untuk merasakan perdagangan bebas risiko
Peluncuran
CandyDrop
Koleksi permen untuk mendapatkan airdrop
Launchpool
Staking cepat, dapatkan token baru yang potensial
HODLer Airdrop
Pegang GT dan dapatkan airdrop besar secara gratis
Pre-IPOs
Buka akses penuh ke IPO saham global
Poin Alpha
Perdagangkan aset on-chain, raih airdrop
Poin Futures
Dapatkan poin futures dan klaim hadiah airdrop
Investasi
Simple Earn
Dapatkan bunga dengan token yang menganggur
Investasi Otomatis
Investasi otomatis secara teratur
Investasi Ganda
Keuntungan dari volatilitas pasar
Soft Staking
Dapatkan hadiah dengan staking fleksibel
Pinjaman Kripto
0 Fees
Menjaminkan satu kripto untuk meminjam kripto lainnya
Pusat Peminjaman
Hub Peminjaman Terpadu
Promosi
AI
Gate AI
Partner AI serbaguna untuk Anda
Gate AI Bot
Gunakan Gate AI langsung di aplikasi sosial Anda
GateClaw
Gate Blue Lobster, langsung pakai
Gate for AI Agent
Infrastruktur AI, Gate MCP, Skills, dan CLI
Gate Skills Hub
10RB+ Skills
Dari kantor hingga trading, satu platform keterampilan membuat AI jadi lebih mudah digunakan
GateRouter
Pilih secara cerdas dari 40+ model AI, dengan 0% biaya tambahan
Google Gemini API bocor "kerentanan biaya cache cepat", pengembang menghapus yang tidak valid dan dikenai denda hingga 20.000 real Brasil
Google AI Pengembang Forum baru-baru ini mengungkapkan kejadian serius terkait anomali biaya API. Seorang pengembang memposting permohonan bantuan, menunjukkan bahwa fitur cache teks Gemini 3 Flash (Context Caching) yang digunakannya, setelah dihapus melalui API di frontend, tetap dikenai biaya secara terus-menerus di backend dengan kecepatan mencengangkan lebih dari seribu yuan per jam, dalam beberapa hari tagihan terkumpul mendekati 20.000 real Brasil (sekitar beberapa ribu dolar AS). Saat ini pengembang tersebut terpaksa menonaktifkan seluruh layanan Gemini API untuk menghentikan kerugian, dan kejadian ini telah menarik perhatian tinggi dari komunitas pengembang.
(Sejarah singkat: Trump mengumumkan masuk saham perusahaan AI AS, kemungkinan minggu ini akan berdiskusi dengan OpenAI, Anthropic, xAI, Altman mengusulkan konsep "Dana Kekayaan Publik")
(Latar belakang tambahan: Sebelum IPO SpaceX, ada pesanan besar terbuka: Google membayar 92 juta dolar AS per bulan untuk menyewa 110.000 GPU NVIDIA)
Daftar Isi Artikel
Toggle
Biaya tersembunyi dari API model besar kecerdasan buatan selalu menjadi perhatian utama pengembang, namun baru-baru ini Gemini API terbaru dari Google mengungkapkan celah "penagihan hantu" yang menakutkan. Di forum pengembang AI Google, sebuah posting berjudul "Darurat: Masalah besar peningkatan biaya cache (Bagian kedua)" mengungkapkan bahwa layanan cache Gemini 3 Flash (Context Caching) tampaknya mengalami kendali biaya yang serius di mekanisme penagihan backend.
Cache yang dihapus tetap dikenai biaya! Per jam biaya melonjak ribuan yuan
Berdasarkan data tagihan BigQuery rinci yang disediakan pengembang Danilo_Oliveira, kejadian abnormal ini dimulai pada 3 Juni 2026. Awalnya, biaya "Token penyimpanan teks cache per jam (SKU ID: 583D-5DB6-4555)" dari Gemini 3 Flash tetap sekitar 20 hingga 30 real Brasil (BRL) per jam, dengan penggunaan sekitar 4 juta Token per jam.
Namun, pada 6 Juni, situasi memburuk secara drastis, biaya menunjukkan lonjakan eksponensial. Penggunaan per jam mencapai lebih dari 200 juta Token per jam, dengan biaya per jam lebih dari 1.000 real Brasil. Pada dini hari 7 Juni, total 341 kejadian penagihan abnormal menyebabkan tagihan kumulatif melonjak ke 17.847,21 real Brasil, menunjukkan sistem penagihan sudah benar-benar tidak terkendali.
Menonaktifkan API secara darurat untuk menghentikan kerugian
Menghadapi tagihan yang membengkak seperti bola salju, pengembang tersebut mengambil semua langkah pencegahan yang mungkin. Ia segera menutup skrip yang menghasilkan cache, dan melalui API REST resmi Google, memastikan daftar cache di frontend sudah "benar-benar dikosongkan". Namun, yang membuat frustrasi, meskipun frontend menunjukkan cache sudah hilang, sistem backend tetap terus memotong biaya tanpa henti.
Diduga ini disebabkan oleh bug di server backend Google yang gagal menghapus catatan cache dengan benar, pengembang tersebut segera membuka tiket masalah tagihan #720261 untuk berusaha bernegosiasi dengan pihak resmi. Untuk menghentikan kerugian finansial yang semakin besar, akhirnya ia memilih langkah terakhir yang ekstrem — menonaktifkan seluruh layanan Gemini API secara total di proyek Google Cloud.
Komunitas pengembang panik, penggunaan fitur cache harus berhati-hati
Setelah kejadian ini terungkap di forum, cepat menarik perhatian dan diskusi dari sesama pengembang. Karena fungsi cache (Context Caching) awalnya dimaksudkan untuk mengatasi biaya dan latensi saat model bahasa besar (LLM) memproses teks panjang, kini justru menjadi lubang hitam yang menyedot dana, hal ini tentu saja mengecewakan perusahaan dan pengembang individu yang sedang bersiap mengadopsi Gemini API secara besar-besaran.
Sebelum Google resmi memperbaiki dan mengumumkan celah backend ini, komunitas sangat menyarankan pengembang yang saat ini menggunakan fitur cache Gemini API untuk memantau tagihan Google Cloud secara real-time, serta mengatur batas anggaran dan mekanisme peringatan secara ketat, agar tidak terkejut dengan tagihan besar yang tak terduga.