API do Google Gemini atinge preços astronómicos: falha de "fatura fantasma" — apagar cache também gera cobranças, mesmo sem saída é cobrado

robot
Geração de resumo em curso
De acordo com o monitoramento Beating, recentemente, o fórum de desenvolvedores de IA do Google revelou várias emergências relacionadas ao sistema de cobrança da API Gemini fora de controle. Vários desenvolvedores enfrentaram cobranças anormais de grandes quantias durante o uso normal, devido a vulnerabilidades no sistema subjacente, por exemplo, alguém foi cobrado quase 27.000 yuans em apenas 12 horas. Atualmente, a equipe de faturamento e a equipe técnica do Google continuam a se culpar mutuamente sobre o assunto, sem divulgar nenhuma declaração oficial de correção ou canal rápido de reembolso. Após investigação, as principais bugs que causaram contas astronômicas aos desenvolvedores são duas: uma é a vulnerabilidade de "cache fantasma", onde, após o cache de contexto criado via API expirar ou ser excluído, a lista de gerenciamento frontend é limpa, mas o sistema de cobrança do Google continua a cobrar a uma taxa de milhares de yuan por hora; a segunda é a armadilha de "loop de pensamento", quando ferramentas de busca conectadas à internet são ativadas, o "limite de orçamento de raciocínio" do modelo falha, levando o modelo a entrar em um raciocínio infinito ao lidar com tarefas simples, consumindo até 64.000 tokens e causando uma falha por timeout, mesmo que ao final não haja "saída" (sem resposta útil), o Google ainda cobra integralmente uma taxa de raciocínio que aumenta 1500 vezes. Devido à severa latência de 32 a 72 horas no sistema de faturamento do Google Cloud, e à falta de um mecanismo de limitação automática de limites, os desenvolvedores já tiveram grandes quantias debitadas antes de receberem alertas. Devido à negligência do suporte oficial e à ausência de respostas positivas nos fóruns, para evitar riscos financeiros, alguns desenvolvedores prejudicados anunciaram que abandonaram completamente o cache de contexto e o modelo de raciocínio do Gemini em ambientes de produção.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado