La API de Google Gemini revela una "vulnerabilidad en la facturación de caché", los desarrolladores eliminan datos inválidos y son golpeados con una deducción masiva de 20,000 reales brasileños

Google AI desarrollador foro recientemente reportó una grave anomalía en la facturación de la API. Un desarrollador publicó un mensaje de ayuda, señalando que la función de caché de texto Gemini 3 Flash (Context Caching) que utiliza, tras eliminarla desde el frontend mediante la API, el backend seguía facturando a un ritmo sorprendente de más de mil yuanes por hora, acumulando en pocos días una factura que se acerca a 20,000 reales brasileños (aproximadamente varios miles de dólares). Actualmente, ese desarrollador ha sido obligado a desactivar completamente el servicio de la API Gemini para detener la hemorragia, y este incidente ha generado gran atención en la comunidad de desarrolladores.
(Resumen previo: Trump propone invertir en empresas de IA estadounidenses, en discusión con OpenAI, Anthropic, xAI esta semana, Altman propone la idea de un «Fondo de Riqueza Pública»)
(Información adicional: Antes de la IPO de SpaceX, se reveló un gran pedido: Google paga 920 millones de dólares mensuales por alquilar 110,000 GPU de NVIDIA)

Índice del artículo

Alternar

  • ¡A pesar de eliminar la caché, siguen cobrando! ¡Facturación explosiva en una hora!
  • Apagón de emergencia de la API para detener la hemorragia, la compañía aún no ha dado solución
  • La comunidad de desarrolladores está en pánico, usar funciones de caché requiere precaución

El costo oculto de las API de modelos de inteligencia artificial, siempre ha sido un punto de preocupación para los desarrolladores, y sin embargo, la más reciente API Gemini de Google ha revelado una vulnerabilidad alarmante de «facturación fantasma». En el foro de desarrolladores de Google AI, una publicación titulada «Urgente: Problema de aumento masivo en costos de caché (Segunda parte)» expuso que el servicio de caché Gemini 3 Flash (Context Caching) parece estar fuera de control en su mecanismo de facturación en el backend.

¡A pesar de eliminar la caché, siguen cobrando! ¡Facturación explosiva en una hora!

Según los datos detallados de facturación en BigQuery proporcionados por el desarrollador Danilo_Oliveira, el incidente comenzó el 3 de junio de 2026. Al principio, el costo del «Token de almacenamiento en caché de texto (SKU ID: 583D-5DB6-4555)» de Gemini 3 Flash se mantuvo en aproximadamente 20 a 30 reales brasileños (BRL) por hora, con un uso de alrededor de 4 millones de tokens por hora.

Sin embargo, para el 6 de junio, la situación se volvió explosiva, con un crecimiento exponencial en los costos. El uso en una sola hora superó los 200 millones de tokens por hora, con cobros superiores a 1,000 reales brasileños por hora. Para la madrugada del 7 de junio, 341 cargos anómalos habían elevado la factura total a 17,847.21 reales, demostrando que el sistema de facturación ya estaba completamente fuera de control.

Apagón de emergencia de la API para detener la hemorragia, la compañía aún no ha dado solución

Frente a una factura astronómica que crecía como bola de nieve, el desarrollador tomó todas las medidas posibles. No solo cerró inmediatamente los scripts que generaban la caché, sino que también consultó la lista de caché mediante la API REST oficial de Google, confirmando que la lista de caché en el frontend ya había sido «completamente vaciada». Sin embargo, lo que fue devastador fue que, aunque en el frontend parecía que no quedaba caché, el sistema backend seguía cobrando sin control.

Dudando que se trate de un error en el que el servidor backend de Google no eliminó correctamente los registros de caché, el desarrollador abrió de urgencia el ticket #720261 para reportar el problema y negociar con el soporte oficial. Para evitar que la situación financiera se vuelva insostenible, finalmente optó por la última medida drástica — desactivar completamente el servicio de la API Gemini en su proyecto de Google Cloud.

La comunidad de desarrolladores en pánico, usar funciones de caché requiere precaución

Tras la exposición del incidente en el foro, rápidamente llamó la atención y generó discusión entre los profesionales del sector. La función de caché (Context Caching), originalmente diseñada para resolver los costos y la latencia en el procesamiento de textos largos por modelos de lenguaje grande (LLM), ahora se ha convertido en un agujero negro que devora fondos, lo cual sin duda impacta a empresas y desarrolladores individuales que planean implementar Gemini API a gran escala.

Antes de que Google corrija oficialmente y publique una explicación sobre esta vulnerabilidad en el backend, la comunidad recomienda encarecidamente a los desarrolladores que actualmente usan la función de caché de Gemini API que monitoreen en tiempo real la facturación en Google Cloud, y establezcan límites de presupuesto y alertas estrictas para evitar enfrentarse a facturas astronómicas sin previo aviso.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado