Googleは最近、Gemini APIの料金プランを更新し、最適化された方案と価格設定を実際の推論使用需要に基づいて策定しました。今回新たに追加された推論サービスのプランは以下の通りです:標準(Standard)、弾力(Flex)、優先(Priority)、バッチ(Batch)、キャッシング(Caching)版。 その中で、弾力推論プランは、非ピーク時のアイドルリソースを利用して、標準価格の半額で提供され、目標遅延は1分から15分ですが、遅延保証はありません。 バッチAPIプランも標準料金の半額で提供され、最大遅延は24時間まで可能です。 キャッシングプランの料金は、キャッシュトークン(Token)の数と保存期間に基づいて決定され、複雑なシステム指示を搭載した対話型ロボット、長時間動画ファイルの繰り返し分析、大規模なドキュメントセットのクエリなどのシナリオに推奨されます。 優先プランの価格は標準価格より75%から100%高く設定されており、遅延はミリ秒から秒単位で制御可能です。 Googleはこのプランを、リアルタイムのカスタマーサポートチャットボット、リアルタイム詐欺検出、ビジネス重要なインテリジェントアシスタントなどのシナリオに推奨しています。
GoogleがGemini APIの価格設定を更新 推論使用に基づく階層料金制
Googleは最近、Gemini APIの料金プランを更新し、最適化された方案と価格設定を実際の推論使用需要に基づいて策定しました。今回新たに追加された推論サービスのプランは以下の通りです:標準(Standard)、弾力(Flex)、優先(Priority)、バッチ(Batch)、キャッシング(Caching)版。
その中で、弾力推論プランは、非ピーク時のアイドルリソースを利用して、標準価格の半額で提供され、目標遅延は1分から15分ですが、遅延保証はありません。
バッチAPIプランも標準料金の半額で提供され、最大遅延は24時間まで可能です。
キャッシングプランの料金は、キャッシュトークン(Token)の数と保存期間に基づいて決定され、複雑なシステム指示を搭載した対話型ロボット、長時間動画ファイルの繰り返し分析、大規模なドキュメントセットのクエリなどのシナリオに推奨されます。
優先プランの価格は標準価格より75%から100%高く設定されており、遅延はミリ秒から秒単位で制御可能です。
Googleはこのプランを、リアルタイムのカスタマーサポートチャットボット、リアルタイム詐欺検出、ビジネス重要なインテリジェントアシスタントなどのシナリオに推奨しています。