Google GeminiがInteractions APIを有効化:インテリジェンスの再構築、「幽霊請求書」を終わらせる

robot
概要作成中
ME AI メッセージ、動察 Beating 監視によると、Googleは正式に Gemini API と Google AI Studio で Interactions API をデフォルトインターフェースに設定し、従来の generateContent インターフェースはメンテナンス期間に入った。新しいインターフェースは、多輪対話、モデルの思考、ツール呼び出しと実行結果を一括してパッケージ化し、サーバー側で Interaction リソースとして保存する。 最も直接的な利点はコストと労力の節約だ。サーバー側で対話状態を自動保存するため、多輪チャット時にクライアントは前回のインタラクションIDだけを送信すればよく、Googleは自動的に再利用しキャッシュヒット率を向上させ、Token費用を大幅に削減できる。コードサンドボックスの実行や深層検索など時間のかかるタスクについては、開発者はバックグラウンドモードを有効にして、作業を非同期で完了させることができる。また、モデルの思考やツール呼び出しなどの中間ステップも完全に可視化され、リアルタイムでエージェントの動作中のバグを排除しやすくなる。基盤のリファクタリングは、6月初旬に発生した課金危機を直接解決した。当時、キャッシュを手動で削除した後、クラウド同期の遅延により、既にログアウトしたリソースがバックグラウンドで稼働し続け、一部アカウントでは12時間以内に約2万7千元の不正な課金が発生した。さらに、モデルがネット検索を行う際に思考の死循環に陥りやすく、回答のない「ゼロ出力」状態でも、6.4万Token分の料金が請求され続けた。Interactions APIは、手動削除の代わりにサーバー管理の「暗黙のキャッシュ」を採用し、開発者がthoughtステップを監視・中止できるようにし、より安全な課金防御を提供している。将来的にGoogleの最先端モデルやインテリジェントエージェント機能(例:Deep Research)はすべてInteractions APIのみをサポートするため、公式は開発者に早期の適応を推奨している。(出典:BlockBeats)
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン留め