据动察 Beating 監測、Liquid AI は二つの小型多模態モデル LFM2.5-VL-1.6B-Extract と LFM2.5-VL-450M-Extract をオープンソース化しました。新モデルは画像の構造化データ抽出に特化して最適化されており、ユーザーが指定したフィールドリストに基づいて、デバイス側で画像を直接 JSON 形式のデータに変換でき、従来の多模態モデルが全文生成後に二次解析を行うステップを省略します。
新モデルは 16 億(1.6B)と 4.5 億(450M)の二つのパラメータ仕様を提供し、LFM Open License v1.0 で公開されています。公式評価によると、新モデルは文書スキャン、車載キャビン理解、工業検査などのシナリオで優れた性能を示しています。ベンチマーク評価では、1.6B モデルは 40 億(4B)クラスの汎用多模態モデルに匹敵し、450M モデルは 20 億(2B)クラスのモデルに匹敵します。
展開面では、新モデルは各種スマートハードウェアやエッジデバイスのチップ(SoC)に最適化されており、車載キャビン理解、文書スキャン、工業検査などのエッジ側シナリオでオフライン展開が可能です。Liquid AI は現在、Hugging Face プラットフォームでモデルの重みのダウンロードを公開しています。
3.45M 人気度
2.16M 人気度
54.04K 人気度
657.21M 人気度
1.36M 人気度
Liquid AIオープンソースの小型多モーダルモデル:端末側で直接画像をJSON構造化データに抽出
据动察 Beating 監測、Liquid AI は二つの小型多模態モデル LFM2.5-VL-1.6B-Extract と LFM2.5-VL-450M-Extract をオープンソース化しました。新モデルは画像の構造化データ抽出に特化して最適化されており、ユーザーが指定したフィールドリストに基づいて、デバイス側で画像を直接 JSON 形式のデータに変換でき、従来の多模態モデルが全文生成後に二次解析を行うステップを省略します。
新モデルは 16 億(1.6B)と 4.5 億(450M)の二つのパラメータ仕様を提供し、LFM Open License v1.0 で公開されています。公式評価によると、新モデルは文書スキャン、車載キャビン理解、工業検査などのシナリオで優れた性能を示しています。ベンチマーク評価では、1.6B モデルは 40 億(4B)クラスの汎用多模態モデルに匹敵し、450M モデルは 20 億(2B)クラスのモデルに匹敵します。
展開面では、新モデルは各種スマートハードウェアやエッジデバイスのチップ(SoC)に最適化されており、車載キャビン理解、文書スキャン、工業検査などのエッジ側シナリオでオフライン展開が可能です。Liquid AI は現在、Hugging Face プラットフォームでモデルの重みのダウンロードを公開しています。