Google Gemini ativa a API de Interações: reformula o agente inteligente, põe fim às "faturas fantasmas"

robot
Geração do resumo em andamento
ME AI Mensagem, de acordo com o monitoramento do Beating, o Google oficialmente definiu a API de Interações como padrão no Gemini API e no Google AI Studio, enquanto a antiga API generateContent entrou em período de manutenção. A nova API irá consolidar diálogos de múltiplas rodadas, raciocínio do modelo, chamadas de ferramentas e resultados de execução, armazenando tudo como recurso de Interação no servidor. O benefício mais direto é economia de dinheiro e esforço. Como o estado do diálogo será salvo automaticamente no servidor, durante conversas de várias rodadas, o cliente só precisa enviar o ID da interação anterior, permitindo que o Google reutilize automaticamente e aumente a taxa de cache, reduzindo significativamente os custos de Token. Para tarefas que consomem tempo, como execução em sandbox de código ou buscas profundas, os desenvolvedores podem ativar o modo de background, permitindo que o trabalho seja concluído assíncronamente em segundo plano. Além disso, etapas intermediárias como raciocínio do modelo e chamadas de ferramentas são totalmente visíveis, facilitando a identificação de bugs durante a execução do agente inteligente em tempo real. A reestruturação de baixo nível resolveu diretamente a crise de cobrança que surgiu no início de junho. Naquela época, após excluir manualmente o cache, devido à latência de sincronização na nuvem, recursos já desativados continuaram operando em segundo plano, levando a cobranças anômalas de quase 27 mil yuans em 12 horas para algumas contas. Além disso, o modelo, ao fazer buscas na internet, frequentemente entrava em um ciclo de raciocínio sem saída, e mesmo sem nenhuma resposta, na condição de "saída zero", ainda era cobrado pelo limite de 64 mil tokens. A API de Interações substitui o cache "implícito" hospedado no servidor, eliminando a necessidade de exclusões manuais, e permite que os desenvolvedores monitorem e interrompam etapas de raciocínio, oferecendo uma defesa mais segura contra cobranças indevidas. Como os futuros modelos de ponta e funcionalidades de agentes inteligentes do Google (como Deep Research) suportarão apenas a API de Interações, a recomendação oficial é que os desenvolvedores façam a adaptação o quanto antes. (Fonte: BlockBeats)
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado