Mô hình nhỏ trực tiếp xuất JSON, việc trích xuất tài liệu phía cuối cuối cùng không cần phải viết bài nhỏ rồi phân tích nữa, 450M đã có thể chạy rất mượt.

Xem bản gốc
CoinNetwork
Liquid AI mô hình đa phương thức nhỏ mã nguồn mở: Trích xuất hình ảnh trực tiếp thành dữ liệu có cấu trúc JSON trên thiết bị cuối
Liquid AI mở mã nguồn hai mô hình đa phương thức nhỏ gọn là lfm2.5-vl-1.6b-extract và lfm2.5-vl-450m-extract, được tối ưu hóa cho việc trích xuất dữ liệu cấu trúc hình ảnh, có thể chuyển đổi trực tiếp hình ảnh thành JSON trên thiết bị theo danh sách trường, loại bỏ bước tạo toàn văn rồi phân tích. Cung cấp hai phiên bản 1.6b và 450m, tuân theo giấy phép mở lfm v1.0. Đánh giá chính thức cho thấy hiệu suất xuất sắc trong các lĩnh vực quét tài liệu, hiểu nội thất xe và kiểm tra công nghiệp; trong các bài kiểm tra chuẩn, 1.6b sánh ngang với mô hình chung 4b, 450m tương đương với mô hình 2b. Hiện đã mở tải trọng số trên Hugging Face.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim