Google додала мультимодальний пошук файлів у API Gemini.


Зараз він може одночасно шукати зображення та текст, а також додавати фільтри за користувацькими метаданими, і надає цитати на рівні сторінки. Людям, що займаються RAG, це має швидко стати у нагоді.
Я особливо ціную, що він нарешті почав обробляти сценарії з гібридними даними, зображення, версії контрактів, стан баз знань — все в одному процесі пошуку, що значно спрощує роботу. Ті, хто займається службою підтримки, пошуком юридичних документів або управлінням контентними активами, можуть вже ознайомитися.
Офіційна документація тут:
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити