API do Google Gemini atinge preço astronômico com falha de "fatura fantasma": excluir cache também gera cobrança, saída zero também é cobrada

robot
Geração do resumo em andamento
De acordo com o monitoramento do Beating, recentemente, o fórum de desenvolvedores de IA do Google revelou várias emergências relacionadas ao sistema de cobrança do API Gemini que saiu do controle. Vários desenvolvedores enfrentaram cobranças anormais de valores elevados durante o uso normal, devido a vulnerabilidades no sistema subjacente, por exemplo, alguém foi cobrado quase 27.000 yuans em apenas 12 horas. Atualmente, a equipe de faturamento e a equipe técnica do Google continuam a se culpar mutuamente sobre o assunto, sem divulgar nenhuma declaração oficial de correção ou canal de reembolso rápido.
Após investigação, as principais bugs que causaram contas astronômicas para os desenvolvedores são dois: primeiro, a vulnerabilidade de "cache fantasma", onde o cache de contexto criado pelos desenvolvedores via API expira ou é excluído, a lista de gerenciamento no front-end é limpa, mas o faturamento no backend do Google continua a cobrar a uma taxa de milhares de yuan por hora; segundo, a armadilha de "loop de pensamento", quando ferramentas de busca conectadas à internet são ativadas, o "limite de orçamento de raciocínio" do modelo falha, levando o modelo a entrar em um raciocínio infinito ao lidar com tarefas simples, consumindo até 64.000 tokens e travando por timeout, mesmo que não retorne nenhuma resposta útil ("saída zero"), o Google ainda cobra integralmente uma taxa de raciocínio que aumenta 1500 vezes.
Devido à severa latência de 32 a 72 horas no sistema de cobrança do Google Cloud, e à falta de um mecanismo de limitação automática de limites, os desenvolvedores já eram cobrados antes de receberem alertas. Como o suporte oficial evita responsabilidades e o fórum não responde de forma direta, alguns desenvolvedores vítimas anunciaram que abandonaram completamente o cache de contexto e o modelo de raciocínio do Gemini em ambientes de produção para evitar riscos financeiros.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado