Microsoft відкриває вихідний код трьох версій моделей вбудовування тексту Harrier, версія 27B посідає перше місце у багатомовному MTEB v2

AirdropBlackHole · 2026-03-30T19:50:16+00:00

Microsoft відкрила вихідний код багатомовних моделей векторного представлення тексту harrier-oss-v1 на Hugging Face, пропонуючи три версії (270M, 0.6B, 27B). Ці моделі підтримують різні завдання і добре показали себе на бенчмарку Multilingual MTEB v2.

AirdropBlackHole

2026-03-30 19:50:16

Генерація анотацій у процесі

Згідно з моніторингом 1M AI News, Microsoft відкрила вихідний код сімейства багатомовної моделі текстових векторних вкладень harrier-oss-v1 на Hugging Face, яке включає три версії: 270M, 0.6B і 27B. У картці моделі вказано, що ця серія використовує архітектуру лише з декодером, пулінг за останнім токеном і L2-нормалізацію, підтримуючи максимум 32,768 токенів. Її можна використовувати для пошуку (retrieval), кластеризації, семантичної подібності, класифікації, білінгвального майнінгу та перестановки (reordering). Multilingual MTEB v2 — це широко використовуваний у галузі бенчмарк для багатомовних текстових векторних вкладень, який в основному тестує такі задачі, як пошук, класифікація, кластеризація та семантична подібність. Згідно з карткою моделі від Microsoft, показники трьох версій на цьому бенчмарку становлять 66.5, 69.0 і 74.3, причому версія 27B посіла перше місце того ж дня, коли її випустили. Версії 270M і 0.6B також використовують більші моделі векторних вкладень для дистиляції знань, а всі три моделі випущені під ліцензією MIT.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

2 лайків