Atualização da Pesquisa de Arquivos da API Gemini com RAG multimodal: verificação mista de texto e imagem, filtragem por metadados, referências a nível de página

Notícias do CoinWorld, o Google lançou três atualizações para a ferramenta de Pesquisa de Arquivos da API Gemini. Uma é a pesquisa multimodal: baseada no modelo Gemini embedding 2, imagens e textos enviados pelos desenvolvedores podem ser indexados e pesquisados de forma unificada em um mesmo repositório de conhecimento, permitindo encontrar materiais com um estilo visual ou tom emocional específicos usando linguagem natural. A segunda é o filtro de metadados personalizado: ao fazer upload de arquivos, é possível adicionar etiquetas de chave-valor (como department: legal), e na consulta, filtrar previamente por essas etiquetas, reduzindo o escopo da pesquisa. A terceira é a citação precisa por página: ao responder, o modelo indicará de qual arquivo e página a informação foi retirada, facilitando ao usuário verificar diretamente. A Pesquisa de Arquivos é um sistema RAG (recuperação aprimorada por geração) totalmente gerenciado integrado na API Gemini do Google, que cuida automaticamente do armazenamento de arquivos, particionamento, vetorização e injeção de contexto. A geração de embeddings durante armazenamento e consulta é gratuita, sendo cobrada apenas na primeira indexação a 0,15 dólares por milhão de tokens.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar