Qwen3.5-Omni model multimodal lengkap Alibaba Qianwen telah diluncurkan

MetaMuskRat · 2026-04-01T19:28:00+00:00

Ali Qianwen merilis model besar Qwen3.5-Omni yang baru, termasuk tiga ukuran versi Instruct, mendukung konteks panjang 256k dan input audio-video yang kaya. Model ini telah melalui pelatihan multimodal skala besar, menunjukkan kemampuan persepsi dan generasi yang kuat, serta meningkatkan dukungan multibahasa, mampu mengenali 113 bahasa dan dialek.

MetaMuskRat

2026-04-01 19:28:00

Pembuatan abstrak sedang berlangsung

人民财讯 30 Maret, Alibaba Qianwen mengumumkan bahwa model generatif multimodal sepenuhnya Qwen3.5-Omni telah diluncurkan. Seri Qwen3.5-Omni mencakup versi Instruct dalam tiga ukuran: Plus, Flash, dan Light, mendukung konteks panjang 256k; model mendukung input audio lebih dari 10 jam serta input video dan audio 720P (1FPS) lebih dari 400 detik. Model menjalani pelatihan pra-generatif multimodal asli pada sejumlah besar data teks, visual, serta lebih dari 100 juta jam data video dan audio. Model ini menunjukkan kemampuan persepsi dan generasi multimodal sepenuhnya yang luar biasa. Dibandingkan dengan Qwen3-Omni, kemampuan multibahasa Qwen3.5-Omni meningkat secara signifikan, sehingga dapat mendukung pengenalan suara untuk 113 bahasa dan dialek serta generasi suara untuk 36 bahasa dan dialek.

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.