Modelos pequenos geram JSON diretamente, extração de documentos no lado do cliente finalmente não precisa mais escrever um pequeno texto antes de analisar, com 450M consegue rodar de forma bem eficiente

Ver original
CoinNetwork
Liquid AI modelo multimodal de pequeno porte de código aberto: extrair imagens diretamente como dados estruturados JSON no lado do dispositivo
Liquid AI lança duas modelos de código aberto de tamanho reduzido e multimodalidade: lfm2.5-vl-1.6b-extract e lfm2.5-vl-450m-extract, otimizados para extração de dados estruturados de imagens, podendo converter imagens diretamente em JSON no dispositivo com base na lista de campos, eliminando a etapa de geração de texto completo e posterior análise. Oferecendo versões de 1.6b e 450m, seguindo a licença open source lfm v1.0. Avaliações oficiais mostram desempenho excelente em tarefas como digitalização de documentos, compreensão de cabines de veículos e inspeção industrial; nos testes de benchmark, o de 1.6b é comparável a modelos gerais de 4b, enquanto o de 450m equivale a um modelo de 2b. Os pesos já estão disponíveis para download no Hugging Face.
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado