Grok paket lengkap suara masuk API, sistem infotainment Tesla dan layanan pelanggan Starlink sudah menggunakannya, data pengujian mandiri WER terlihat bagus tapi tunggu pengujian ulang dari pihak ketiga dulu

Lihat Asli
MeNews
xAI membuka API audio Grok STT dan TTS, tingkat kesalahan kata keseluruhan STT ditekan hingga 6,9%
Berita ME melaporkan bahwa xAI meluncurkan dua API audio independen: Grok STT dan Grok TTS, yang berasal dari tumpukan audio yang sama, mendukung Grok Voice, sistem kendaraan Tesla, dan layanan pelanggan Starlink. STT menyediakan transkripsi batch REST dan streaming real-time WebSocket, dengan cap waktu tingkat kata, pemisahan pembicara, multi-saluran, dan normalisasi teks terbalik, mencakup lebih dari 25 bahasa; TTS mendukung label internal untuk emosi dan intonasi. Dan mengumumkan perbandingan WER, Grok unggul dalam berbagai skenario, belum ada pengujian ulang dari pihak ketiga. Harga: STT batch $0,10 per jam, streaming $0,20 per jam, TTS $4,20 per juta karakter.
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan