Google Gemini ativa a API de Interações: reformula o agente inteligente, põe fim às «faturas fantasmas»

robot
Geração de resumo em curso
ME AI Mensagem, de acordo com o monitoramento do Beating, o Google oficialmente definiu a API de Interações como padrão no Gemini API e no Google AI Studio, enquanto a antiga API generateContent entrou em período de manutenção. A nova API irá consolidar diálogos de múltiplas rodadas, raciocínio do modelo, chamadas de ferramentas e resultados de execução, armazenando tudo no servidor como recurso de Interação. O benefício mais direto é economia de dinheiro e esforço. Como o estado do diálogo será salvo automaticamente no servidor, durante conversas de múltiplas rodadas, o cliente só precisa enviar o ID da interação anterior, permitindo que o Google reutilize automaticamente e aumente a taxa de acerto de cache, reduzindo significativamente os custos com Tokens. Para tarefas que consomem tempo, como execução em sandbox de código ou buscas profundas, os desenvolvedores podem ativar o modo de background, permitindo que o trabalho seja concluído assíncronamente em segundo plano. Além disso, etapas intermediárias como raciocínio do modelo e chamadas de ferramentas são totalmente visíveis, facilitando a detecção de bugs durante a execução do agente inteligente em tempo real. A reestruturação de baixo nível resolveu diretamente a crise de cobrança que surgiu no início de junho. Naquela ocasião, após excluir manualmente o cache, devido ao atraso na sincronização na nuvem, recursos já desativados continuaram operando em segundo plano, levando a cobranças anormais de quase 27.000 yuans em até 12 horas em algumas contas. Além disso, o modelo, ao realizar buscas na internet, frequentemente entrava em um ciclo de raciocínio sem saída, e mesmo sem fornecer respostas, continuava sendo cobrado pelo limite de 64.000 Tokens. A API de Interações substituiu o cache "implícito" hospedado no servidor, eliminando a necessidade de exclusões manuais, e permite que os desenvolvedores monitorem e interrompam etapas de raciocínio, oferecendo uma defesa mais segura contra cobranças indevidas. Como os futuros modelos de ponta e funcionalidades de agentes inteligentes do Google (como Deep Research) suportarão apenas a API de Interações, a recomendação oficial é que os desenvolvedores façam a adaptação o mais cedo possível. (Fonte: BlockBeats)
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado