Qwen3.5-Omni model multimodal lengkap Alibaba Qianwen telah diluncurkan

BlockBeatNews · 2026-03-30T14:07:23+00:00

Ali Qianwen meluncurkan model besar multimodal Qwen3.5-Omni pada 30 Maret, mendukung konteks panjang 256k dan berbagai input audio dan video, meningkatkan kemampuan multibahasa, mampu mengenali 113 bahasa dan dialek, serta menghasilkan 36 jenis suara.

BlockBeatNews

2026-03-30 14:07:23

Pembuatan abstrak sedang berlangsung

Pesan BlockBeats, 30 Maret, Alibaba Qianwen mengumumkan peluncuran model large multimodal Qwen3.5-Omni. Seri Qwen3.5-Omni mencakup versi Instruct dalam tiga ukuran, yaitu Plus, Flash, dan Light, mendukung konteks panjang 256k; model mendukung input audio lebih dari 10 jam dan input audio-visual lebih dari 400 detik pada 720P (1FPS). Model melakukan pretraining multimodal native pada volume besar data teks, visual, serta audio-visual yang melebihi 100 juta jam; model ini menunjukkan kemampuan persepsi dan generasi multimodal yang sangat baik. Dibandingkan dengan Qwen3-Omni, kemampuan multibahasa Qwen3.5-Omni meningkat secara signifikan, mampu mendukung pengenalan suara untuk 113 bahasa dan dialek serta pembangkitan suara untuk 36 bahasa dan dialek. (Jin10)

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.