A Microsoft torna de código aberto três versões dos modelos de incorporação de texto Harrier, sendo a versão 27B a melhor classificada no Multilingual MTEB v2

AirdropBlackHole · 2026-03-30T19:50:16+00:00

A Microsoft open-sourced os modelos de incorporação de texto multilíngue harrier-oss-v1 na Hugging Face, oferecendo três versões (270M, 0.6B, 27B). Estes modelos suportam várias tarefas e tiveram uma boa pontuação no benchmark Multilingual MTEB v2.

AirdropBlackHole

2026-03-30 19:50:16

Geração de resumo em curso

De acordo com o acompanhamento da 1M AI News, a Microsoft disponibilizou em código aberto a família de modelos de incorporação de texto multilingue harrier-oss-v1 na Hugging Face, que inclui três versões: 270M, 0.6B e 27B. A ficha do modelo indica que esta série utiliza uma arquitectura apenas com decoder, pooling apenas do último token e normalização L2, suportando um máximo de 32,768 tokens. Pode ser utilizada para pesquisa, agrupamento (clustering), similaridade semântica, classificação, mineração bilingue (bilingual mining) e reordenação. O Multilingual MTEB v2 é um benchmark amplamente utilizado para incorporações de texto multilingues na indústria, testando principalmente tarefas como pesquisa, classificação, agrupamento e similaridade semântica. De acordo com a ficha do modelo da Microsoft, as pontuações das três versões neste benchmark são 66.5, 69.0 e 74.3, sendo a versão 27B a alcançar o primeiro lugar no dia do seu lançamento. As versões 270M e 0.6B também utilizam modelos de incorporação maiores para destilação de conhecimento, e todos os três modelos são disponibilizados sob a licença MIT.

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.

2 gostos