Liquid AI modelo multimodal de pequeno porte de código aberto: extrair imagens diretamente como dados estruturados JSON no lado do dispositivo

robot
Geração do resumo em andamento
De acordo com o monitoramento Beating, a Liquid AI lançou duas versões de modelos multimodais de pequeno porte, LFM2.5-VL-1.6B-Extract e LFM2.5-VL-450M-Extract. Os novos modelos foram otimizados especificamente para extração de dados estruturados de imagens, podendo converter imagens em formato JSON diretamente na borda do dispositivo com base na lista de campos especificada pelo usuário, eliminando a etapa de geração de texto completo e subsequente análise por modelos multimodais tradicionais.

Os novos modelos oferecem duas configurações de parâmetros, 1,6 bilhão (1.6B) e 450 milhões (450M), e são lançados sob a licença LFM Open License v1.0. Avaliações oficiais mostram que os novos modelos apresentam desempenho excelente em cenários como digitalização de documentos, compreensão de cabines de veículos e inspeção industrial. Nos testes de benchmark, o modelo de 1,6B de desempenho pode competir com modelos multimodais gerais de 40 bilhões (4B), enquanto o modelo de 450M pode rivalizar com modelos de 20 bilhões (2B).

Na fase de implantação, os novos modelos foram adaptados para diferentes hardwares inteligentes e chips de dispositivos de borda (SoC), podendo ser implantados offline em cenários como compreensão de cabines de veículos, digitalização de documentos e inspeção industrial. A Liquid AI já disponibilizou os pesos do modelo para download na plataforma Hugging Face.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado