Grok meluncurkan kloning suara: rekam satu menit, lalu bisa membuat suara AI sendiri

robot
Pembuatan abstrak sedang berlangsung

Menurut pemantauan Beating, xAI meluncurkan Grok Custom Voices dan Voice Library. Pengguna dapat merekam suara di konsol xAI, menghasilkan voice_id mereka sendiri, lalu mengintegrasikannya dengan Grok TTS atau Voice Agent API, digunakan untuk skenario agen layanan pelanggan, pembuatan konten, karakter game, narasi buku audio, dan lain-lain.

Fitur ini tidak sekadar mengunggah audio untuk melakukan kloning. Pengguna perlu membaca kalimat verifikasi, sistem akan melakukan transkripsi real-time menggunakan STT, dan membandingkan fitur pembicara dari rekaman verifikasi dan rekaman lengkap, memastikan orang yang sama sebelum suara dihasilkan. xAI menyatakan bahwa ini dapat mencegah penggunaan rekaman yang sudah ada untuk mengkloning suara orang lain.

Saat ini Custom Voices hanya tersedia di Amerika Serikat, kecuali Illinois. Konsol dapat secara gratis membuat hingga 30 suara kustom, kemampuan pembuatan API hanya tersedia untuk tim Enterprise. Suara kustom sendiri tidak dikenai biaya tambahan, tetapi pemanggilan API suara tetap dikenai biaya sesuai volume: Realtime sebesar $3,00/jam, Text to Speech sebesar $4,20 juta karakter.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan