Liquid AI نموذج متعدد الوسائط صغير الحجم ومفتوح المصدر: استخراج الصور مباشرة على الطرف باستخدام هيكل بيانات JSON من البيانات المنظمة

robot
إنشاء الملخص قيد التقدم
وفقًا لمراقبة Beating، قامت Liquid AI بفتح مصدر نموذجين متعددين الوسائط صغيري الحجم هما LFM2.5-VL-1.6B-Extract و LFM2.5-VL-450M-Extract. تم تحسين النموذجين خصيصًا لاستخراج البيانات الهيكلية من الصور، بحيث يمكنهما تحويل الصور مباشرة إلى بيانات بصيغة JSON على الجهاز بناءً على قائمة الحقول التي يحددها المستخدم، مما يلغي خطوة التحليل الثانوي بعد توليد النص الكامل بواسطة النماذج متعددة الوسائط التقليدية.

يقدم النموذجان مواصفات من حيث عدد المعاملات تبلغ 1.6 مليار (1.6B) و 450 مليون (450M)، ويصدران بموجب بروتوكول ترخيص LFM Open License v1.0. أظهرت التقييمات الرسمية أن النموذجين يقدمان أداءً ممتازًا في سيناريوهات مثل مسح المستندات، وفهم مقصورة السيارة، والكشف الصناعي. في تقييمات المعايير، يمكن لنموذج 1.6B أن ينافس نماذج متعددة الوسائط عامة بقوة تصل إلى 4 مليارات (4B)، بينما يمكن لنموذج 450M أن يعادل نماذج بقوة 2 مليار (2B).

على مستوى النشر، تم تكييف النموذجين مع مختلف أنواع الأجهزة الذكية ورقائق الحوسبة الطرفية (SoC)، بحيث يمكن نشرهما بشكل غير متصل في سيناريوهات مثل فهم مقصورة السيارة، ومسح المستندات، والكشف الصناعي. لقد أتاحت Liquid AI الآن تحميل أوزان النموذج على منصة Hugging Face.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت