Búsqueda de archivos de la API de Gemini con actualización multimodal RAG: búsqueda combinada de texto e imágenes, filtrado por metadatos, referencias a nivel de página

Mensaje de CoinWorld, Google ha lanzado tres actualizaciones para la herramienta de Búsqueda de Archivos del API Gemini.
Primero, búsqueda multimodal: basada en el modelo Gemini embedding 2, los desarrolladores pueden subir imágenes y textos que serán indexados y buscados en la misma base de conocimientos, permitiendo encontrar material con estilos visuales o tonos emocionales específicos usando lenguaje natural.
Segundo, filtrado de metadatos personalizados: al subir archivos, se pueden agregar etiquetas clave-valor (como department: legal), y durante la consulta se prefiltra por etiquetas, reduciendo el rango de búsqueda.
Tercero, referencia precisa a nivel de página: el modelo indicará en qué página de qué archivo proviene la información en sus respuestas, facilitando que el usuario pueda verificar directamente.
File Search es un sistema RAG (recuperación mejorada por generación) totalmente gestionado integrado en el API Gemini de Google, que maneja automáticamente el almacenamiento de archivos, segmentación, vectorización y la inyección de contexto.
La generación de embeddings durante el almacenamiento y la consulta es gratuita, solo se cobra en la primera indexación a 0.15 dólares por millón de tokens.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado