Mô hình đa phương thức toàn diện của Alibaba Qwen3.5-Omni đã ra mắt

robot
Đang tạo bản tóm tắt

Tin nhắn từ Deep Tide TechFlow, ngày 30 tháng 3, theo báo cáo của Jin10 Data, Alibaba Qianwen đã công bố việc ra mắt mô hình đa phương thức toàn diện Qwen3.5-Omni. Dòng Qwen3.5-Omni bao gồm phiên bản Instruct ở ba kích thước Plus, Flash và Light, hỗ trợ ngữ cảnh dài 256k. Mô hình hỗ trợ đầu vào âm thanh dài hơn 10 giờ và đầu vào âm thanh/video độ phân giải 720P (1FPS) dài hơn 400 giây. Mô hình được huấn luyện đa phương thức nguyên bản (native) trên khối lượng lớn dữ liệu văn bản, hình ảnh và dữ liệu âm thanh/video hơn 100 triệu giờ, thể hiện năng lực cảm nhận và tạo sinh đa phương thức vượt trội. So với Qwen3-Omni, năng lực đa ngôn ngữ của Qwen3.5-Omni đã được cải thiện đáng kể, có thể hỗ trợ nhận dạng giọng nói cho 113 ngôn ngữ và phương ngữ và tạo giọng nói cho 36 ngôn ngữ và phương ngữ.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Gate Fun hot

    Xem thêm
  • Vốn hóa:$2.27KNgười nắm giữ:2
    0.00%
  • Vốn hóa:$2.37KNgười nắm giữ:2
    1.04%
  • Vốn hóa:$2.24KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.24KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.25KNgười nắm giữ:1
    0.00%
  • Ghim