Model besar multimodal Alibaba Qwen3.5-Omni telah diluncurkan

CycleProphet · 2026-03-30T13:46:45+00:00

Ali Qianwen merilis model besar multimodal Qwen3.5-Omni, mendukung konteks panjang 256k dan input audio lebih dari 10 jam, menunjukkan kemampuan persepsi dan generasi multimodal yang luar biasa, meningkatkan fungsi multibahasa, mendukung 113 jenis pengenalan suara dan 36 jenis generasi suara.

CycleProphet

2026-03-30 13:46:45

Pembuatan abstrak sedang berlangsung

Berita dari Deep Tide TechFlow, pada 30 Maret, menurut laporan dari Jintou Data, Alibaba Qianwen mengumumkan peluncuran model skala besar Qwen3.5-Omni berbasis full-modality. Seri Qwen3.5-Omni mencakup versi Instruct dalam tiga ukuran: Plus, Flash, dan Light, serta mendukung konteks panjang 256k. Model mendukung masukan audio lebih dari 10 jam dan masukan audio-visual lebih dari 400 detik pada 720P (1FPS). Model menjalani pretraining multimodal native pada teks dalam jumlah besar, visi, serta data audio-visual yang lebih dari 100 juta jam, dan model ini menunjukkan kemampuan persepsi serta generasi full-modality yang sangat unggul. Dibandingkan dengan Qwen3-Omni, kemampuan multibahasa Qwen3.5-Omni meningkat secara signifikan; ia dapat mendukung pengenalan suara dalam 113 bahasa dan dialek, serta generasi suara dalam 36 bahasa dan dialek.

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.