La API de Google Gemini revela una vulnerabilidad de "facturación fantasma" con tarifas astronómicas: eliminar la caché también genera cargos, y sin salida también se factura

robot
Generación de resúmenes en curso

Según la monitorización de Beating, recientemente, el foro de desarrolladores de IA de Google reveló múltiples solicitudes de ayuda urgentes relacionadas con la pérdida de control del sistema de facturación de Gemini API. Varios desarrolladores enfrentaron cargos anómalos de gran magnitud durante el uso normal, debido a vulnerabilidades en el sistema subyacente, por ejemplo, alguien fue cobrado casi 27,000 yuanes en solo 12 horas. Actualmente, el equipo de facturación y el equipo técnico de Google siguen echándose la culpa mutuamente, sin publicar ninguna declaración oficial de reparación o canales rápidos de reembolso.

Tras la investigación, las principales dos fallas que causaron las facturas astronómicas a los desarrolladores son: primero, la vulnerabilidad de "caché fantasma", donde después de que el caché de contexto creado por los desarrolladores a través de la API expira o se elimina, la lista de gestión en el frontend se limpia, pero el backend de Google sigue cobrando a una tasa de miles de yuanes por hora en "vacío"; segundo, la trampa de "bucle de pensamiento", cuando se habilitan herramientas como búsqueda en línea, el "límite de presupuesto de pensamiento" del modelo falla, causando que el modelo entre en un razonamiento infinito al procesar tareas simples, agotando hasta 64,000 tokens y colapsando por tiempo de espera, incluso si finalmente no devuelve ninguna respuesta útil ("salida cero"), Google aún cobra en su totalidad un costo de pensamiento que aumenta 1500 veces.

Debido a que el sistema de facturación de Google Cloud tiene un retraso severo de 32 a 72 horas, y carece de un mecanismo de corte automático por límite, los desarrolladores ya han sido gravados antes de recibir alertas. Debido a la evasión de responsabilidad por parte del soporte oficial y la falta de respuestas en los foros, algunos desarrolladores afectados han anunciado que abandonarán por completo el caché de contexto y el modelo de razonamiento de Gemini en entornos de producción para evitar riesgos financieros.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado