Hỗ trợ 3500 cặp ngôn ngữ! Alibaba phát hành mô hình dịch thuật tăng cường thị giác đầu tiên Qwen3.5-LiveTranslate

robot
Đang tạo bản tóm tắt
AIMPACT tin tức, ngày 20 tháng 5 (UTC+8), theo giám sát của Động Sát Beating, hệ thống dịch thuật đồng thời đang tiến hóa từ dịch thuật giọng nói đơn điệu thành một phiên dịch kỹ thuật số toàn diện có thể hiểu hình ảnh và sao chép giọng nói con người. Vào ngày 19 tháng 5, Phòng thí nghiệm Thông minh Ali chính thức công bố ra mắt mô hình dịch thuật đồng thời âm thanh và video thế hệ mới Qwen3.5-LiveTranslate, nâng cấp đáng kể khả năng dịch thuật đồng thời lên hơn 3.500 cặp ngôn ngữ, và lần đầu tiên hỗ trợ sao chép giọng nói thời gian thực, tùy chỉnh từ khóa nóng và hiểu thị giác. Mô hình mới dựa trên kiến trúc Qwen3.5-Omni, hiện hỗ trợ hiểu và viết 60 ngôn ngữ, cũng như đầu ra giọng nói cho 29 ngôn ngữ. Không giống như phần mềm dịch thuật đồng thời truyền thống chỉ nghe giọng nói, mô hình mới giới thiệu ngữ cảnh thị giác thời gian thực để loại bỏ sự mơ hồ về ngữ nghĩa. Ví dụ, khi trong video xuất hiện một loại khẩu trang cụ thể, hệ thống có thể kết hợp các đặc điểm thị giác để phân biệt chính xác khẩu trang y tế và mặt nạ hóa trang trong tiếng Anh, từ đó bù đắp sự thiếu hụt thông tin giọng nói. Để loại bỏ sai lệch phiên âm do tiếng ồn và giọng địa phương, mô hình mới còn giới thiệu cơ chế tiêm từ khóa nóng động. Lý do rất đơn giản: người dùng có thể chỉ định trực tiếp tên người, thương hiệu hoặc thuật ngữ chuyên ngành cụ thể trong luồng dịch, buộc khóa bản dịch chính xác, tránh các danh từ riêng bị trôi trong quá trình dịch đồng thời. Khi dịch đồng thời giữa các ngôn ngữ, mô hình còn hỗ trợ sao chép giọng nói con người thời gian thực, có thể tái tạo âm sắc và giọng điệu gốc của người nói trong luồng dịch đồng thời. Hiện tại, mô hình mới đã được mở trên nền tảng trải nghiệm Qwen Omni, và API trong tương lai sẽ đăng nhập vào nền tảng Bách Luyện của Alibaba Cloud. (Nguồn: BlockBeats)
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận