A Microsoft torna de código aberto três versões dos modelos de incorporação de texto Harrier, sendo a versão 27B a melhor classificada no Multilingual MTEB v2

robot
Geração de resumo em curso

De acordo com o acompanhamento da 1M AI News, a Microsoft disponibilizou em código aberto a família de modelos de incorporação de texto multilingue harrier-oss-v1 na Hugging Face, que inclui três versões: 270M, 0.6B e 27B. A ficha do modelo indica que esta série utiliza uma arquitectura apenas com decoder, pooling apenas do último token e normalização L2, suportando um máximo de 32,768 tokens. Pode ser utilizada para pesquisa, agrupamento (clustering), similaridade semântica, classificação, mineração bilingue (bilingual mining) e reordenação. O Multilingual MTEB v2 é um benchmark amplamente utilizado para incorporações de texto multilingues na indústria, testando principalmente tarefas como pesquisa, classificação, agrupamento e similaridade semântica. De acordo com a ficha do modelo da Microsoft, as pontuações das três versões neste benchmark são 66.5, 69.0 e 74.3, sendo a versão 27B a alcançar o primeiro lugar no dia do seu lançamento. As versões 270M e 0.6B também utilizam modelos de incorporação maiores para destilação de conhecimento, e todos os três modelos são disponibilizados sob a licença MIT.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar