Mendukung 3500 pasangan bahasa! Alibaba merilis model besar interpretasi simultan yang ditingkatkan secara visual pertama, Qwen3.5-LiveTranslate

robot
Pembuatan abstrak sedang berlangsung
AIMPACT Berita, 20 Mei (UTC+8), menurut pemantauan Beating, sistem penerjemahan simultan sedang berevolusi dari penerjemahan suara yang monoton menjadi penerjemah digital multimodal yang dapat memahami gambar dan mengkloning suara manusia. Pada 19 Mei, Laboratorium Tongyi Alibaba secara resmi mengumumkan peluncuran model besar penerjemahan simultan audio-video real-time generasi baru, Qwen3.5-LiveTranslate, yang secara signifikan meningkatkan kemampuan penerjemahan simultan real-time menjadi lebih dari 3.500 pasangan bahasa, dan untuk pertama kalinya mendukung kloning suara real-time, kustomisasi kata kunci, dan pemahaman visual. Model baru ini didasarkan pada arsitektur Qwen3.5-Omni, yang kini mendukung pemahaman dan penulisan dalam 60 bahasa, serta keluaran suara dalam 29 bahasa. Berbeda dengan perangkat lunak penerjemahan simultan tradisional yang hanya mendengarkan suara, model baru ini memperkenalkan konteks visual real-time untuk menghilangkan ambiguitas semantik. Misalnya, ketika masker tertentu muncul dalam video, sistem dapat menggabungkan fitur visual untuk membedakan secara tepat antara masker medis dan topeng pesta dansa dalam bahasa Inggris, sehingga mengkompensasi kekurangan informasi suara. Untuk menghilangkan penyimpangan transkripsi yang disebabkan oleh kebisingan dan aksen, model baru ini juga memperkenalkan mekanisme injeksi kata kunci dinamis. Alasannya sederhana: pengguna dapat secara langsung menentukan nama orang, merek, atau istilah industri tertentu dalam aliran terjemahan, memaksa terjemahan yang benar, dan mencegah istilah khusus menyimpang selama penerjemahan simultan. Saat melakukan penerjemahan simultan lintas bahasa, model juga mendukung kloning suara real-time, yang dapat mereproduksi timbre dan nada suara asli pembicara secara real-time dalam aliran penerjemahan simultan. Saat ini, model baru telah tersedia di platform pengalaman Qwen Omni, dan di masa depan API akan masuk ke platform Alibaba Cloud Bailian. (Sumber: BlockBeats)
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar