Berita dari Coinjie Wang, Alibaba Qianwen mengumumkan peluncuran model besar multimodal Qwen3.5-Omni. Seri Qwen3.5-Omni mencakup versi Instruct dalam tiga ukuran: Plus, Flash, dan Light, mendukung konteks panjang 256k, model ini mendukung input audio lebih dari 10 jam dan input audio-video 720P (1FPS) lebih dari 400 detik. Model ini melakukan pra-pelatihan multimodal asli pada volume besar teks, visual, dan lebih dari 100 juta jam data audio dan video, menunjukkan kemampuan persepsi dan generasi multimodal yang luar biasa. Dibandingkan dengan Qwen3-Omni, kemampuan multibahasa Qwen3.5-Omni meningkat secara signifikan, mampu mendukung pengenalan suara dalam 113 bahasa dan dialek serta generasi suara dalam 36 bahasa dan dialek.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan