ByteDance merilis model suara dua arah Seeduplex, interaksi suara AI memasuki era 「dengarkan sekaligus bicara」

robot
Pembuatan abstrak sedang berlangsung

AIMPACT Pesan, 9 April, tim Seed dari ByteDance merilis model suara dua arah asli Seeduplex, dan telah diluncurkan secara penuh di aplikasi Doubao, menandai peningkatan dari interaksi suara yang “giliran” ke percakapan alami secara waktu nyata.


Seeduplex melalui pemodelan gabungan suara dan semantik, mewujudkan kemampuan pemrosesan sinkron “dengar sambil bicara”, dengan peningkatan signifikan dalam ketahanan terhadap gangguan di lingkungan yang kompleks. Data menunjukkan, dibandingkan dengan solusi semi-dua arah tradisional, tingkat kesalahan balasan dan gangguan yang salah turun sekitar 50%.


Dalam pengalaman interaktif, model ini memperkenalkan teknologi penentuan berhenti dinamis, memperpendek latensi respons sekitar 250 milidetik, mengurangi fenomena berbicara secara bersamaan sebesar 40%, dan dapat membedakan dengan lebih akurat antara jeda pengguna dan akhir percakapan. Selain itu, melalui sampling spekulatif dan optimisasi kuantisasi, sistem tetap mempertahankan latensi rendah dan kelancaran dalam skenario dengan lalu lintas tinggi, meningkatkan kepuasan panggilan secara keseluruhan sekitar 8,34%.


Peningkatan ini menandai evolusi AI suara menuju “interaksi waktu nyata, multimodal, dan mirip manusia”, dan di masa depan diharapkan menggabungkan kemampuan visual, mendorong asisten pintar menuju pengembangan terintegrasi “dengar, lihat, pikir, bicara”. (Sumber: ByteDance)



Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan