Atualização da Pesquisa de Arquivos da API Gemini com RAG multimodal: verificação mista de texto e imagem, filtragem por metadados, referências a nível de página

Notícias do Coinjie.com, o Google lançou três atualizações para a ferramenta de Pesquisa de Arquivos da API Gemini. Uma é a pesquisa multimodal: baseada no modelo Gemini embedding 2, imagens e textos enviados pelos desenvolvedores podem ser indexados e pesquisados de forma unificada em um mesmo repositório de conhecimento, permitindo encontrar materiais com estilos visuais ou tons emocionais específicos usando linguagem natural. A segunda é o filtro de metadados personalizado: ao fazer upload de arquivos, é possível adicionar etiquetas de chave-valor (como department: legal), e na consulta, filtrar previamente por essas etiquetas, reduzindo o escopo da pesquisa. A terceira é a citação precisa por página: ao responder, o modelo indicará de qual arquivo e página a informação foi retirada, facilitando ao usuário verificar diretamente. A Pesquisa de Arquivos é um sistema RAG (recuperação aprimorada por geração) totalmente gerenciado integrado à API Gemini do Google, que cuida automaticamente do armazenamento de arquivos, particionamento, vetorização e injeção de contexto. A geração de embeddings durante armazenamento e consulta é gratuita, sendo cobrada apenas na indexação inicial a US$ 0,15 por milhão de tokens.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado