Alibaba merilis generasi baru model multimodal besar Qwen3.5-Omni

robot
Pembuatan abstrak sedang berlangsung

30 Maret, Alibaba merilis model multimodal generasi baru Qwen3.5-Omni “Qianwen” yang sepenuhnya multimodal. Model ini meraih SOTA (kinerja terbaik) dalam 215 tugas seperti pemahaman, pengenalan, dan interaksi audio-visual, melampaui Gemini-3.1 Pro, dan menjadi salah satu model multimodal sepenuhnya terkuat saat ini di dunia. Model baru ini memiliki kemampuan pemahaman audio-visual dan interaksi real-time yang sangat kuat; model ini dapat menghasilkan deskripsi terstruktur yang detail dan dapat dikendalikan dari konten audio-visual, mampu mengenali jumlah bahasa dan dialek yang mencapai 113 jenis, dan secara mengejutkan juga memunculkan kemampuan “Vibe Coding” pada audio-visual.

Saat ini, Aliyun Bailian telah menghadirkan tiga jenis API Qwen3.5-Omni, yaitu Plus, Flash, dan Light. API ini dapat diterapkan secara luas di industri seperti platform video pendek/live streaming, game, dan kreator media mandiri. Pengguna umum juga dapat pergi ke Qwen Chat untuk mencoba secara gratis; pengembang dan perusahaan dapat memanggil model Qwen3.5-Omni melalui platform Aliyun Bailian, dengan biaya input kurang dari 0,8 yuan per satu juta Tokens (token).

(Sumber: Harian Ekonomi)

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan