xAI essa API de áudio tem uma precificação interessante, STT em lote é só 0,1 dólar por hora, TTS na verdade é mais caro, chegando a 4,2 dólares por milhão de caracteres, esse valor de etiqueta de sentimento é esse prêmio?

Ver original
MeNews
xAI abre API de áudio Grok STT e TTS, taxa de erro geral de palavras do STT reduzida para 6,9%
ME News reporta que a xAI lançou duas APIs de áudio independentes: Grok STT e Grok TTS, ambas originadas da mesma pilha de áudio, suportando Grok Voice, sistemas de bordo da Tesla e atendimento ao cliente Starlink, entre outros.
O STT oferece transcrição em lote via REST e fluxo em tempo real via WebSocket, com marcações de tempo por palavra, separação de falantes, múltiplos canais e normalização reversa de texto, cobrindo mais de 25 idiomas;
O TTS suporta etiquetas embutidas de emoção e prosódia. E divulgou uma comparação de WER, onde Grok lidera em múltiplos cenários, sem testes de terceiros até o momento.
Preço: processamento em lote de STT a 0,10 dólares por hora, streaming a 0,20 dólares por hora, e TTS a 4,20 dólares por milhão de caracteres.
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado