Mô hình đa phương thức toàn diện Qwen3.5-Omni của Alibaba đã chính thức ra mắt

BlockBeatNews · 2026-03-30T14:07:23+00:00

Alibaba Qianwen vào ngày 30 tháng 3 đã ra mắt mô hình đa phương thức toàn diện Qwen3.5-Omni, hỗ trợ ngữ cảnh dài 256k và nhiều loại đầu vào âm thanh và video, nâng cao khả năng đa ngôn ngữ, có thể nhận diện 113 loại ngôn ngữ và phương ngữ, tạo ra 36 loại giọng nói.

BlockBeatNews

2026-03-30 14:07:23

Đang tạo bản tóm tắt

Tin nhắn BlockBeats, ngày 30 tháng 3, Alibaba Qianwen đã công bố việc ra mắt mô hình đa phương thức toàn diện Qwen3.5-Omni. Dòng Qwen3.5-Omni bao gồm các phiên bản Instruct ở ba kích thước Plus, Flash và Light, hỗ trợ ngữ cảnh dài 256k; mô hình hỗ trợ đầu vào âm thanh dài hơn 10 giờ và đầu vào âm thanh/hình video 720P (1FPS) dài hơn 400 giây. Mô hình được huấn luyện đa phương thức nguyên sinh trên lượng dữ liệu lớn văn bản, hình ảnh và hơn 100 triệu giờ dữ liệu âm thanh/hình video, cho thấy năng lực cảm nhận và tạo sinh đa phương thức vượt trội. So với Qwen3-Omni, năng lực đa ngôn ngữ của Qwen3.5-Omni đã được nâng cao đáng kể, có thể hỗ trợ nhận dạng giọng nói cho 113 ngôn ngữ và phương ngữ và tạo giọng nói cho 36 ngôn ngữ và phương ngữ. (Kim Thập)

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.