Peningkatan Pencarian File API Gemini dengan RAG multimodal: pencocokan gambar dan teks, penyaringan metadata, referensi tingkat halaman

Berita dari CoinWorld, Google meluncurkan tiga pembaruan untuk alat File Search pada Gemini API. Pertama adalah pencarian multimodal: berdasarkan model Gemini embedding 2, gambar dan teks yang diunggah pengembang dapat diindeks dan dicari secara bersamaan dalam satu basis pengetahuan, menggunakan bahasa alami untuk menemukan materi yang sesuai dengan gaya visual atau suasana hati tertentu dari koleksi gambar. Kedua adalah penyaringan metadata kustom: saat mengunggah file, pengguna dapat menambahkan label kunci-nilai (misalnya departemen: legal), dan saat pencarian dapat melakukan pra-filter berdasarkan label tersebut, mempersempit ruang pencarian. Ketiga adalah kutipan presisi tingkat halaman: saat model menjawab, akan dicantumkan dari halaman berapa file informasi tersebut berasal, memudahkan pengguna langsung melompat dan memverifikasi. File Search adalah sistem RAG (retrieval-augmented generation) yang sepenuhnya dikelola dan terintegrasi dalam Gemini API milik Google, secara otomatis menangani penyimpanan file, pemecahan, vektorisasi, dan injeksi konteks. Pembuatan embedding saat penyimpanan dan pencarian gratis, hanya dikenai biaya $0,15 per juta token saat indeks pertama kali dibuat.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan