xAI meluncurkan API Ucapan ke Teks dan Teks ke Ucapan Grok

robot
Pembuatan abstrak sedang berlangsung
BERITA ME, 18 April (UTC+8), xAI baru-baru ini mengumumkan peluncuran resmi dua API audio independen yaitu Grok Speech-to-Text (STT) dan Grok Text-to-Speech (TTS). Grok STT menawarkan layanan transkripsi dengan akurasi tinggi dan latensi rendah, mendukung pemrosesan batch melalui REST API dan transkripsi streaming waktu nyata melalui WebSocket API, serta dilengkapi dengan penanda waktu tingkat kata, pemisahan pembicara, dukungan multi-saluran, dan fitur normalisasi teks terbalik yang cerdas. Dalam artikel disebutkan bahwa dalam pengujian standar di bidang panggilan telepon, rapat, video/podcast, dan lain-lain, tingkat kesalahan kata dari layanan ini lebih baik dibandingkan model komersial utama seperti ElevenLabs, Deepgram, dan AssemblyAI. Layanan ini mendukung lebih dari 25 bahasa, dengan harga $0,10 per jam untuk pemrosesan batch dan $0,20 per jam untuk streaming. Grok TTS dapat menghasilkan suara yang cepat, alami, dan ekspresif, mendukung kontrol granular melalui label suara sederhana, dengan harga $4,20 untuk setiap 1 juta karakter. Kedua API ini didasarkan pada teknologi yang sama yang digunakan untuk mendukung Grok Voice, kendaraan Tesla, dan pelanggan Starlink. (Sumber: InFoQ)
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 5
  • 2
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Mint-ColoredCalmness
· 4jam yang lalu
Apakah sistem suara mobil Tesla akan diperbarui? Starlink juga bisa digunakan, cukup menarik
Lihat AsliBalas0
SummerNightColdWallet
· 4jam yang lalu
Apa itu teknologi canggih normalisasi teks terbalik, otomatis mengubah angka menjadi teks?
Lihat AsliBalas0
NekoValidator
· 4jam yang lalu
0.1 dolar/jam harga grosir, lebih dari 25 bahasa, gelombang ini akan membuat Whisper mati kompetisi
Lihat AsliBalas0
Cream-ColoredCross-ChainBridge
· 4jam yang lalu
REST batch + mode streaming WebSocket, tingkat kemudahan pengembang maksimal
Lihat AsliBalas0
GateUser-deff9ed8
· 4jam yang lalu
xAI mulai menjual API, ekosistem Elon Musk tertutup +1
Lihat AsliBalas0
  • Disematkan