Recherche de fichiers API Gemini avec mise à niveau RAG multimodal : vérification croisée texte-image, filtrage par métadonnées, références au niveau des pages

Le site Web CoinWorld rapporte que Google a lancé trois mises à jour pour l’outil de recherche de fichiers de l’API Gemini. La première est la recherche multimodale : basée sur le modèle Gemini embedding 2, les images et textes téléchargés par les développeurs peuvent être indexés et recherchés dans une même base de connaissances, permettant de trouver en langage naturel des ressources correspondant à un style visuel ou une tonalité émotionnelle spécifiques dans la bibliothèque d’images. La deuxième est le filtrage par métadonnées personnalisées : lors du téléchargement de fichiers, il est possible d’ajouter des étiquettes clé-valeur (par exemple, department : legal), et lors de la requête, de pré-filtrer selon ces étiquettes pour réduire la portée de la recherche. La troisième est la référence précise au niveau des pages : lorsque le modèle répond, il indique de quelle page du fichier provient l’information, facilitant la vérification directe par l’utilisateur. File Search est un système RAG (recherche augmentée par génération) entièrement géré intégré à l’API Gemini de Google, qui automatise le stockage, le découpage, la vectorisation et l’injection de contexte des fichiers. La génération d’embeddings lors du stockage et de la requête est gratuite, seule la première indexation est facturée à 0,15 dollar par million de tokens.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler