Малкая модель напрямую выводит JSON, извлечение документов на стороне клиента наконец-то не требует сначала писать небольшие эссе, а затем анализировать, 450М достаточно для хорошей работы

Посмотреть Оригинал
CoinNetwork
Liquid AI открытая модель с небольшим размером и мультимодальной поддержкой: извлечение изображений прямо на устройстве в виде структурированных данных JSON
Liquid AI выпустила два небольших мультимодальных открытых модели lf m2.5-vl-1.6b-extract и lfm2.5-vl-450m-extract, специально оптимизированных для извлечения структурированных данных изображений, которые могут напрямую преобразовывать изображения в JSON на устройстве по спискам полей, исключая этап полного текста и последующего анализа. Предлагаются версии 1.6b и 450m, соответствующие лицензии lfm open license v1.0. Официальные оценки показывают отличные результаты в сценариях сканирования документов, понимания салона автомобиля и промышленного контроля; в бенчмарках модель 1.6b сравнима с универсальной моделью 4b, а 450m — с моделью 2b. В настоящее время доступны для загрузки на Hugging Face.
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено