Microsoft відкрила вихідний код моделі вбудовування Harrier, яка очолила багатомовний рейтинг MTEB, значно випереджаючи OpenAI та Google

robot
Генерація анотацій у процесі

Повідомлення від CoinWorld: команда Microsoft Bing відкрила серію вбудованих моделей Harrier. Вбудовані моделі є базовим компонентом пошукових систем і RAG-систем: вони відповідають за перетворення тексту на вектори, щоб виконувати пошук і зіставлення. Їхня якість безпосередньо визначає, чи зможе AI-система знайти правильну інформацію. Флагманська версія Harrier-OSS-v1-27B у мультимовному бенчмарку MTEB v2 (охоплює 131 завдання) отримує середнє 74.3, що на 2 відсоткові пункти більше за найвищий попередній результат серед відкритих моделей, і посідає перше місце.

Порівняно із закритими моделями відрив ще більший: OpenAI text-embedding-3-large має середнє 58.92, Google Gemini Embedding 2 — 69.9, Amazon Titan Embed v2 — 60.37.

Розробники синхронно відкрили два легкі варіанти для розгортання в сценаріях із низькою обчислювальною потужністю:

  1. Версія з 0.6B параметрів: середнє 69.0, місце в рейтингу 10; вона вже перевищує Google Gemini Embedding 1 (68.33).
  2. Версія з 270M параметрів: середнє 66.5, місце в рейтингу 15; за мінімальним обсягом вони випереджають одразу три закриті моделі OpenAI та Amazon.

Обидві версії підтримують понад 100 мов і контекстне вікно 32K. Дані для тренування включають понад 2 мільярди пар слабко-наглядових текстових пар (для контрастного донавчання) та 10 мільйонів високоякісних прикладів (для файн-тюнінгу). Синтетичні дані згенеровано GPT-5. Після завершення роботи флагманської моделі її також використовують як модель-вчитель, застосовуючи knowledge distillation, щоб підвищити продуктивність двох малих моделей.

Microsoft зазначає, що технологію Harrier буде інтегровано в пошук Bing і в сервіс Agent нового покоління.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити