مايكروسوفت تفتح مصدر ثلاثة إصدارات من نماذج تضمين النص هارير، وإصدار 27B يتصدر اختبار MTEB متعدد اللغات الإصدار 2

robot
إنشاء الملخص قيد التقدم

وفقًا لمراقبة 1M AI News، قامت شركة Microsoft بإتاحة نموذج عائلة نمذجة تضمين النص متعدد اللغات harrier-oss-v1 كمصدر مفتوح على Hugging Face، ويتضمن ثلاث نسخ: 270M و0.6B و27B. تُشير بطاقة النموذج إلى أن هذه السلسلة تستخدم بنية تعتمد على وحدات فك الترميز فقط، وتجميع آخر رمز، وتطبيع L2، مع دعم لما يصل إلى 32,768 رمزًا. ويمكن استخدامه للاسترجاع، والتجميع العنقودي، والتشابه الدلالي، والتصنيف، واستخراج ثنائي اللغة، وإعادة الترتيب. يُعد Multilingual MTEB v2 معيارًا مستخدمًا على نطاق واسع لتضمينات النص متعدد اللغات في الصناعة، ويختبر بشكل أساسي مهام مثل الاسترجاع والتصنيف والتجميع العنقودي والتشابه الدلالي. ووفقًا لبطاقة نموذج Microsoft، فإن درجات النسخ الثلاث على هذا المعيار هي 66.5 و69.0 و74.3، حيث وصلت نسخة 27B إلى المركز الأول في يوم إصدارها. كما تستخدم نسختا 270M و0.6B نماذج تضمين أكبر للتقطير المعرفي، ويتم إصدار جميع النماذج الثلاثة تحت رخصة MIT.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.25Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.25Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.26Kعدد الحائزين:1
    0.00%
  • تثبيت