Model besar multimodal Alibaba Qwen3.5-Omni telah diluncurkan

robot
Pembuatan abstrak sedang berlangsung

Berita dari Deep Tide TechFlow, pada 30 Maret, menurut laporan dari Jintou Data, Alibaba Qianwen mengumumkan peluncuran model skala besar Qwen3.5-Omni berbasis full-modality. Seri Qwen3.5-Omni mencakup versi Instruct dalam tiga ukuran: Plus, Flash, dan Light, serta mendukung konteks panjang 256k. Model mendukung masukan audio lebih dari 10 jam dan masukan audio-visual lebih dari 400 detik pada 720P (1FPS). Model menjalani pretraining multimodal native pada teks dalam jumlah besar, visi, serta data audio-visual yang lebih dari 100 juta jam, dan model ini menunjukkan kemampuan persepsi serta generasi full-modality yang sangat unggul. Dibandingkan dengan Qwen3-Omni, kemampuan multibahasa Qwen3.5-Omni meningkat secara signifikan; ia dapat mendukung pengenalan suara dalam 113 bahasa dan dialek, serta generasi suara dalam 36 bahasa dan dialek.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan