La API de Google Gemini revela una vulnerabilidad de "facturación fantasma" con tarifas astronómicas: eliminar la caché también genera cargos, y sin salida también se factura

robot
Generación de resúmenes en curso
Según la monitorización de Beating, recientemente, el foro de desarrolladores de IA de Google reveló múltiples solicitudes de ayuda urgentes relacionadas con la pérdida descontrolada del sistema de facturación de Gemini API. Varios desarrolladores enfrentaron cargos anómalos elevados durante el uso normal, debido a vulnerabilidades en el sistema subyacente, por ejemplo, alguien fue cobrado casi 27,000 yuanes en solo 12 horas. Actualmente, el equipo de facturación y el equipo técnico de Google siguen echándose la culpa mutuamente, sin publicar ninguna declaración oficial de reparación o canal de reembolso rápido. Tras la investigación, las principales causas de las facturas astronómicas para los desarrolladores son dos errores clave: uno es la vulnerabilidad de "caché fantasma", donde después de que el caché de contexto creado por los desarrolladores a través de la API expira o se elimina, la lista de gestión en el frontend se limpia, pero en el backend de Google todavía se factura a razón de miles de yuanes por hora; el otro es la trampa de "bucle de pensamiento", cuando se habilitan herramientas como búsqueda en línea, la "restricción de presupuesto de pensamiento" del modelo falla, causando que el modelo entre en un razonamiento infinito al procesar tareas simples, agotando hasta 64,000 tokens y colapsando por timeout, incluso si finalmente no devuelve ninguna respuesta útil ("salida cero"), Google aún cobra en su totalidad un aumento de 1500 veces en los costos de razonamiento. Debido a que el sistema de facturación de Google Cloud tiene un retraso severo de 32 a 72 horas y carece de un mecanismo de corte automático por límite, los desarrolladores ya han sido cobrados antes de recibir alertas. Debido a la evasión de responsabilidad por parte del soporte oficial y la falta de respuestas directas en los foros, algunos desarrolladores afectados han anunciado que abandonarán por completo el caché de contexto y el modelo de razonamiento de Gemini en entornos de producción para evitar riesgos financieros.
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado