Малка модель безпосередньо видає JSON, витяг документів на стороні нарешті більше не потрібно писати короткий текст перед аналізом, 450М достатньо для швидкої роботи, дуже зручно

Переглянути оригінал
CoinNetwork
Liquid AI відкритий малий мультимодальний модель: безпосередньо на стороні пристрою витягує зображення у структуровані дані JSON
Liquid AI відкрила два невеликі мультимодальні моделі lfm2.5-vl-1.6b-extract та lfm2.5-vl-450m-extract, спеціально оптимізовані для витягання структурованих даних з зображень, здатні за допомогою списку полів безпосередньо конвертувати зображення у JSON на пристрої, пропускаючи етап генерації тексту та його аналізу.
Пропонуються два варіанти: 1.6b та 450m, відповідно, з ліцензією lf open license v1.0.
Офіційні оцінки показують високі результати у сценаріях сканування документів, розуміння салону автомобіля та промислового контролю; у бенчмарках модель 1.6b конкурує з універсальними моделями 4b, а 450m — з моделями 2b.
Вже доступні для завантаження ваги на Hugging Face.
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено