Liquid AIオープンソースの小型多モーダルモデル:端末側で直接画像をJSON構造化データに抽出

robot
概要作成中

据动察 Beating 監測、Liquid AI は二つの小型多模態モデル LFM2.5-VL-1.6B-Extract と LFM2.5-VL-450M-Extract をオープンソース化しました。新モデルは画像の構造化データ抽出に特化して最適化されており、ユーザーが指定したフィールドリストに基づいて、デバイス側で画像を直接 JSON 形式のデータに変換でき、従来の多模態モデルが全文生成後に二次解析を行うステップを省略します。

新モデルは 16 億(1.6B)と 4.5 億(450M)の二つのパラメータ仕様を提供し、LFM Open License v1.0 で公開されています。公式評価によると、新モデルは文書スキャン、車載キャビン理解、工業検査などのシナリオで優れた性能を示しています。ベンチマーク評価では、1.6B モデルは 40 億(4B)クラスの汎用多模態モデルに匹敵し、450M モデルは 20 億(2B)クラスのモデルに匹敵します。

展開面では、新モデルは各種スマートハードウェアやエッジデバイスのチップ(SoC)に最適化されており、車載キャビン理解、文書スキャン、工業検査などのエッジ側シナリオでオフライン展開が可能です。Liquid AI は現在、Hugging Face プラットフォームでモデルの重みのダウンロードを公開しています。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし