xAI meluncurkan API Ucapan ke Teks dan Teks ke Ucapan Grok

robot
Pembuatan abstrak sedang berlangsung
BERITA ME, 18 April (UTC+8), xAI baru-baru ini mengumumkan peluncuran resmi dua API audio independen yaitu Grok Speech-to-Text (STT) dan Grok Text-to-Speech (TTS). Grok STT menawarkan layanan transkripsi dengan akurasi tinggi dan latensi rendah, mendukung pemrosesan batch melalui REST API dan transkripsi streaming waktu nyata melalui WebSocket API, serta dilengkapi dengan penanda waktu tingkat kata, pemisahan pembicara, dukungan multi-saluran, dan fitur normalisasi teks terbalik yang cerdas. Dalam artikel disebutkan bahwa dalam pengujian standar di bidang panggilan telepon, rapat, video/podcast, dan lain-lain, tingkat kesalahan kata dari layanan ini lebih baik dibandingkan model komersial utama seperti ElevenLabs, Deepgram, dan AssemblyAI. Layanan ini mendukung lebih dari 25 bahasa, dengan harga $0,10 per jam untuk pemrosesan batch dan $0,20 per jam untuk streaming. Grok TTS dapat menghasilkan suara yang cepat, alami, dan ekspresif, mendukung kontrol granular melalui label suara sederhana, dengan harga $4,20 untuk setiap 1 juta karakter. Kedua API ini didasarkan pada teknologi yang sama yang digunakan untuk mendukung Grok Voice, kendaraan Tesla, dan pelanggan Starlink. (Sumber: InFoQ)
XAI1,88%
GROK-1,1%
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 3
  • 2
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
RedTelephoneBoothRuins
· 6jam yang lalu
Apakah latensi transkripsi waktu nyata WebSocket bisa diatasi, sangat dibutuhkan untuk situasi siaran langsung
Lihat AsliBalas0
QueuePosition
· 6jam yang lalu
Apakah penetapan harga sebesar 4,20 dolar ini hanya bercanda, Elon Musk memang tidak pernah melupakan sifat meme-nya
Lihat AsliBalas0
NeonMargin
· 6jam yang lalu
Timestamp tingkat kata + pemisahan pembicara, kegembiraan dalam mengedit podcast
Lihat AsliBalas0
  • Disematkan