Mô hình đa phương thức toàn diện Qwen3.5-Omni của Alibaba đã chính thức ra mắt

robot
Đang tạo bản tóm tắt

Tin tức Nhân Dân Tài Tín ngày 30 tháng 3, Alibaba Qianwen thông báo ra mắt mô hình ngôn ngữ đa phương thức toàn diện Qwen3.5-Omni. Dòng Qwen3.5-Omni bao gồm phiên bản Instruct ở ba kích thước Plus, Flash và Light, hỗ trợ ngữ cảnh dài 256k; mô hình hỗ trợ đầu vào âm thanh trên 10 giờ và đầu vào âm video 720P (1FPS) trên 400 giây. Mô hình được huấn luyện đa phương thức nguyên sinh trên khối lượng lớn dữ liệu văn bản, hình ảnh và âm video vượt quá 100 triệu giờ; mô hình thể hiện khả năng cảm nhận và tạo sinh đa phương thức vượt trội. So với Qwen3-Omni, khả năng đa ngôn ngữ của Qwen3.5-Omni đã được tăng cường đáng kể, có thể hỗ trợ nhận dạng giọng nói cho 113 ngôn ngữ và phương ngữ, và tạo giọng nói cho 36 ngôn ngữ và phương ngữ.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim