Google añade búsqueda de archivos multimodal a la API Gemini.


Ahora puede buscar imágenes y texto juntos, también permite filtrar con metadatos personalizados, y ofrece citas a nivel de página.
Quienes hacen RAG deberían poder usarlo de inmediato.
Lo que valoro más es que finalmente empieza a manejar escenarios de datos híbridos, poner materiales visuales, versiones de contratos, estado de la base de conocimientos en un mismo proceso de búsqueda será mucho más eficiente.
Las personas que trabajan en bases de conocimientos de atención al cliente, búsqueda de documentos legales, o gestión de activos de contenido pueden echarle un vistazo primero.
La documentación oficial está aquí:
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado