Model kecil langsung mengeluarkan JSON, ekstraksi dokumen di sisi klien akhirnya tidak perlu menulis esai kecil dulu lalu menganalisisnya, 450M sudah cukup berjalan dengan lancar

Lihat Asli
CoinNetwork
Liquid AI model multimodal kecil sumber terbuka: langsung mengekstrak gambar menjadi data terstruktur JSON di sisi perangkat
Liquid AI merilis dua model multimodal berukuran kecil open source yaitu lfm2.5-vl-1.6b-extract dan lfm2.5-vl-450m-extract, yang dioptimalkan untuk ekstraksi data terstruktur gambar, mampu mengubah gambar langsung menjadi JSON di perangkat berdasarkan daftar bidang, menghilangkan langkah pembuatan teks lengkap dan analisisnya. Menyediakan dua varian 1.6b dan 450m, mengikuti lisensi open source LFM v1.0. Penilaian resmi menunjukkan performa yang baik dalam pemindaian dokumen, pemahaman kabin kendaraan, dan inspeksi industri; dalam pengujian benchmark, 1.6b setara dengan model umum 4b, dan 450m setara dengan model 2b. Saat ini sudah tersedia untuk diunduh di Hugging Face.
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan