Gemini APIのファイル検索のマルチモーダルRAGへのアップグレード:画像とテキストの混合検出、メタデータフィルタリング、ページ番号レベルの引用

币界网消息、GoogleはGemini APIのFile Searchツールに三つのアップデートを発表しました。一つはマルチモーダル検索:Gemini embedding 2モデルに基づき、開発者がアップロードした画像とテキストを同じ知識ベースで統一的にインデックス化・検索できるようになり、自然言語で特定の視覚スタイルや感情調の素材を画像ライブラリから見つけ出せます。二つはカスタムメタデータフィルタリング:ファイルアップロード時にキーと値のタグ(例:department: legal)を付加し、クエリ時にタグで事前フィルタリングして検索範囲を狭めることが可能です。三つはページ番号レベルの正確な引用:モデルの回答時に情報がどのファイルの何ページから来たのかを示し、ユーザーが直接ジャンプして確認できるようになっています。File SearchはGoogleがGemini APIに内蔵した完全管理型のRAG(検索強化生成)システムで、ファイルの保存、分割、ベクトル化、コンテキスト注入を自動的に処理します。保存と検索時のembedding生成は無料で、最初のインデックス作成時に1百万トークンあたり0.15ドルの料金がかかります。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン