Qwen3.5-Omni model multimodal lengkap Alibaba Qianwen telah diluncurkan

robot
Pembuatan abstrak sedang berlangsung

人民财讯 30 Maret, Alibaba Qianwen mengumumkan bahwa model generatif multimodal sepenuhnya Qwen3.5-Omni telah diluncurkan. Seri Qwen3.5-Omni mencakup versi Instruct dalam tiga ukuran: Plus, Flash, dan Light, mendukung konteks panjang 256k; model mendukung input audio lebih dari 10 jam serta input video dan audio 720P (1FPS) lebih dari 400 detik. Model menjalani pelatihan pra-generatif multimodal asli pada sejumlah besar data teks, visual, serta lebih dari 100 juta jam data video dan audio. Model ini menunjukkan kemampuan persepsi dan generasi multimodal sepenuhnya yang luar biasa. Dibandingkan dengan Qwen3-Omni, kemampuan multibahasa Qwen3.5-Omni meningkat secara signifikan, sehingga dapat mendukung pengenalan suara untuk 113 bahasa dan dialek serta generasi suara untuk 36 bahasa dan dialek.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan