STT tingkat kesalahan kata lebih rendah daripada pesaing, TTS juga dapat disesuaikan nada bicara dengan label, menggunakan satu rangkaian teknologi yang sama untuk memberi makan ke Grok Voice, Tesla, dan Starlink—Musk ini ingin menguasai seluruh alur interaksi suara dari hulu ke hilir.

Lihat Asli
MeNews
xAI meluncurkan API Ucapan ke Teks dan Teks ke Ucapan Grok
ME News melaporkan bahwa xAI secara resmi meluncurkan dua API audio independen, Grok STT dan Grok TTS. Grok STT memiliki tingkat akurasi tinggi, latensi rendah, mendukung pemrosesan batch REST, transkripsi waktu nyata WebSocket, dilengkapi dengan cap waktu tingkat kata, pemisahan pembicara, multi-saluran, dan normalisasi teks terbalik cerdas, mencakup lebih dari 25 bahasa; biaya batch 0,10 dolar AS per jam, streaming 0,20 dolar AS per jam, tingkat kesalahan kata lebih baik dari beberapa pesaing. Grok TTS menyediakan suara yang cepat, alami, dan dapat dikontrol secara halus melalui label, dengan harga 4,20 dolar AS per juta karakter. Keduanya berbasis teknologi yang sama, digunakan oleh Grok Voice, Tesla, dan Starlink.
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan