Model suara ini bahkan dapat menangkap ekspresi mikro, kombinasi kepribadian sebanyak jutaan, ke depannya pembawa acara virtual mungkin akan sulit membedakan yang asli dan yang palsu

Lihat Asli
MeNews
StepAudio 2.5 rilis suara waktu nyata: persepsi bahasa tambahan dan interaksi personalisasi
StepAudio 2.5 Realtime adalah sebuah model suara real-time yang dapat mengenali fitur bahasa tambahan seperti intonasi, kecepatan bicara, jeda, dan ekspresi mikro. Melalui API, dapat menghubungkan ke kepribadian yang dapat disesuaikan, menetapkan kepribadian, latar belakang cerita, dan gaya bahasa, dengan puluhan ribu opsi kepribadian asli, kombinasi mencapai jutaan fitur. Dilengkapi dengan 5 kepribadian bawaan, disesuaikan melalui RLHF, mampu menjaga konsistensi bahkan dalam skenario peran yang kompleks, mendukung bahasa Mandarin dan Inggris.
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan