Qwen3.5-Omni model multimodal lengkap Alibaba Qianwen telah diluncurkan

robot
Pembuatan abstrak sedang berlangsung

Pesan BlockBeats, 30 Maret, Alibaba Qianwen mengumumkan peluncuran model large multimodal Qwen3.5-Omni. Seri Qwen3.5-Omni mencakup versi Instruct dalam tiga ukuran, yaitu Plus, Flash, dan Light, mendukung konteks panjang 256k; model mendukung input audio lebih dari 10 jam dan input audio-visual lebih dari 400 detik pada 720P (1FPS). Model melakukan pretraining multimodal native pada volume besar data teks, visual, serta audio-visual yang melebihi 100 juta jam; model ini menunjukkan kemampuan persepsi dan generasi multimodal yang sangat baik. Dibandingkan dengan Qwen3-Omni, kemampuan multibahasa Qwen3.5-Omni meningkat secara signifikan, mampu mendukung pengenalan suara untuk 113 bahasa dan dialek serta pembangkitan suara untuk 36 bahasa dan dialek. (Jin10)

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan