API do Google Gemini atinge preço astronômico com falha de "fatura fantasma": excluir cache também gera cobrança, saída zero também é cobrada

robot
Geração do resumo em andamento

De acordo com o monitoramento do Beating, recentemente, o fórum de desenvolvedores de IA do Google revelou várias emergências relacionadas ao sistema de cobrança do API Gemini que saiu do controle. Vários desenvolvedores enfrentaram cobranças anormais de valores elevados durante o uso normal, devido a vulnerabilidades no sistema subjacente, por exemplo, alguém foi cobrado quase 27.000 yuans em apenas 12 horas. Atualmente, a equipe de faturamento e a equipe técnica do Google continuam se culpando mutuamente sobre o assunto, sem divulgar nenhuma declaração oficial de correção ou canal de reembolso rápido.

Após investigação, os principais bugs que causaram contas astronômicas para os desenvolvedores são dois: primeiro, a vulnerabilidade de "cache fantasma", onde o cache de contexto criado pelos desenvolvedores via API expira ou é excluído, a lista de gerenciamento no front-end é limpa, mas o sistema de cobrança do Google continua cobrando a uma taxa de milhares de yuan por hora; segundo, a armadilha de "loop de pensamento", quando ferramentas de busca conectadas à internet são ativadas, o "limite de orçamento de raciocínio" do modelo falha, levando o modelo a entrar em raciocínio infinito ao lidar com tarefas simples, consumindo até 64.000 tokens e causando uma falha por timeout, mesmo que não retorne nenhuma resposta útil ("saída zero"), o Google ainda cobra integralmente uma taxa de raciocínio que aumenta 1500 vezes.

Devido à severa latência de 32 a 72 horas no sistema de cobrança do Google Cloud, e à ausência de um mecanismo automático de limitação de limites, os desenvolvedores já eram cobrados antes de receberem alertas. Como o suporte oficial evita responsabilidades e o fórum não responde de forma direta, para evitar riscos financeiros, alguns desenvolvedores prejudicados anunciaram que abandonaram completamente o cache de contexto e o modelo de raciocínio do Gemini em ambientes de produção.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado