ترقية البحث عن الملفات في واجهة برمجة تطبيقات Gemini إلى نمط متعدد الوسائط RAG: التحقق المختلط من النص والصورة، تصفية البيانات الوصفية، الإشارة إلى مستوى الصفحة

موقع Coinjie News، أطلقت جوجل ثلاث تحديثات لأداة البحث عن الملفات في واجهة برمجة التطبيقات Gemini. الأول هو البحث متعدد الوسائط: استنادًا إلى نموذج Gemini embedding 2، يمكن للمطورين رفع الصور والنصوص ليتم فهرستها واسترجاعها بشكل موحد في نفس قاعدة المعرفة، ويمكن العثور على مواد تتوافق مع نمط بصري معين أو مزاج عاطفي باستخدام اللغة الطبيعية من مكتبة الصور. الثاني هو تصفية البيانات الوصفية المخصصة: عند رفع الملفات، يمكن إرفاق علامات مفتاحية بقيم (مثل department: legal)، وعند الاستعلام يتم تصفية النتائج مسبقًا حسب العلامات، مما يقلل من نطاق البحث. الثالث هو الإشارة الدقيقة على مستوى الصفحة: عند إجابة النموذج، يتم تحديد الصفحة التي تأتي منها المعلومات من الملف، مما يسهل على المستخدم الانتقال مباشرة للتحقق. يعد البحث عن الملفات نظام RAG (الاسترجاع المعزز للتوليد) المُدار بالكامل المدمج في واجهة برمجة تطبيقات Gemini من جوجل، والذي يتولى تلقائيًا تخزين الملفات وتقسيمها وتحويلها إلى متجهات وحقن السياق. يتم توفير إنشاء التضمينات أثناء التخزين والاستعلام مجانًا، ويتم فرض رسوم قدرها 0.15 دولار لكل مليون رمز عند الفهرسة لأول مرة.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت