PP-OCRv6 đưa nhiều ngôn ngữ vào cùng một mô hình, từ biên đến đám mây đều bao gồm, OCR nội địa cuối cùng đã bắt đầu phát triển mạnh mẽ rồi

Xem bản gốc
CoinNetwork
Baidu phát hành PP-OCRv6: hàng chục triệu tham số sánh ngang với VLM tỷ tỷ, mô hình đơn hỗ trợ 50 loại ngôn ngữ
Baidu飞桨 phát hành PP-OCRv6, phiên bản mới cung cấp ba mô hình tiny1.5m, small7.7m, medium34.5m, bao phủ biên, trình duyệt và đám mây. So với v5, độ chính xác phát hiện và nhận dạng tăng 4.6% và 5.1%, đồng thời tích hợp tiếng Trung, tiếng Anh, tiếng Nhật và 46 ngôn ngữ Latin vào cùng một mô hình. Mạng phát hiện/nhận dạng thiết kế mới giới thiệu mô-đun thống nhất và cấu trúc tái tham số hóa, nâng cao độ chính xác và giảm yêu cầu tính toán. Được tối ưu hóa dưới OpenVINO, khả năng suy luận CPU toàn bộ hệ thống trên medium tăng tối đa 5.2 lần, mã nguồn đã được tích hợp vào PaddleOCR và mở nguồn.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim