Google Gemini active l'API Interactions : restructuration de l'agent intelligent, fin des « factures fantômes »

robot
Création du résumé en cours
ME AI Message, selon le monitoring de Beating, Google a officiellement défini l'API Interactions comme interface par défaut dans Gemini API et Google AI Studio, l'ancienne interface generateContent étant en période de maintenance. La nouvelle interface regroupe la conversation multi-tours, la réflexion du modèle, l'appel d'outils et les résultats d'exécution, et les stocke en tant que ressource Interaction côté serveur. Le bénéfice le plus direct est d’économiser de l’argent et des efforts. Étant donné que l’état de la conversation est automatiquement sauvegardé côté serveur, lors de conversations multi-tours, le client n’a qu’à envoyer l’ID de l’interaction précédente, ce qui permet à Google de réutiliser automatiquement et d’augmenter le taux de cache, réduisant considérablement les coûts en tokens. Pour l’exécution dans un sandbox de code ou les tâches de recherche approfondie, les développeurs peuvent activer le mode arrière-plan, permettant au travail de s’exécuter de façon asynchrone en arrière-plan. De plus, les étapes intermédiaires telles que la réflexion du modèle et l’appel d’outils sont entièrement visibles, facilitant le dépannage en temps réel des bugs du système intelligent. La refonte sous-jacente a directement résolu la crise de facturation survenue début juin. À cette époque, après avoir supprimé manuellement le cache, en raison du retard de synchronisation dans le cloud, les ressources désactivées continuaient de fonctionner en arrière-plan, ce qui a entraîné des déductions anormales d’environ 27 000 RMB en 12 heures pour certains comptes. De plus, lors de la recherche en ligne, le modèle pouvait tomber dans une boucle de pensée infinie, et en état de « sortie zéro » sans aucune réponse, il était toujours facturé jusqu’à 64 000 tokens. L’API Interactions a remplacé la « mise en cache implicite » hébergée sur serveur par une suppression manuelle, et permet aux développeurs de surveiller et d’interrompre l’étape de réflexion, offrant une protection plus sûre contre la facturation abusive. Étant donné que les modèles de pointe et les fonctionnalités d’agents intelligents futurs de Google (comme Deep Research) ne supporteront que l’API Interactions, il est conseillé aux développeurs de finaliser leur adaptation dès que possible. (Source : BlockBeats)
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé