Liquid AI model multimodal kecil sumber terbuka: langsung mengekstrak gambar menjadi data terstruktur JSON di sisi perangkat

robot
Pembuatan abstrak sedang berlangsung
Menurut pemantauan Beating, Liquid AI merilis dua model multimodal berukuran kecil, LFM2.5-VL-1.6B-Extract dan LFM2.5-VL-450M-Extract. Model baru ini secara khusus dioptimalkan untuk ekstraksi data terstruktur dari gambar, mampu mengubah gambar menjadi data format JSON langsung di perangkat sesuai daftar bidang yang ditentukan pengguna, menghilangkan langkah tradisional model multimodal yang menghasilkan teks lengkap lalu melakukan analisis kedua.

Model baru ini menawarkan dua spesifikasi parameter, 1,6 miliar (1.6B) dan 450 juta (450M), dirilis dengan lisensi LFM Open License v1.0. Penilaian resmi menunjukkan bahwa model baru ini berkinerja sangat baik dalam skenario pemindaian dokumen, pemahaman kabin kendaraan, dan inspeksi industri. Dalam pengujian benchmark, model 1,6B mampu bersaing dengan model multimodal umum berukuran 4B, sementara model 450M setara dengan model berukuran 2B.

Dalam hal penerapan, model baru ini telah diadaptasi untuk berbagai perangkat keras cerdas dan chip perangkat edge (SoC), dapat melakukan penerapan offline di skenario kabin kendaraan, pemindaian dokumen, dan inspeksi industri. Liquid AI kini telah menyediakan unduhan bobot model di platform Hugging Face.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan