Futuros
Aceda a centenas de contratos perpétuos
TradFi
Ouro
Plataforma de ativos tradicionais globais
Opções
Hot
Negoceie Opções Vanilla ao estilo europeu
Conta Unificada
Maximize a eficiência do seu capital
Negociação de demonstração
Introdução à negociação de futuros
Prepare-se para a sua negociação de futuros
Eventos de futuros
Participe em eventos para recompensas
Negociação de demonstração
Utilize fundos virtuais para experimentar uma negociação sem riscos
Lançamento
CandyDrop
Recolher doces para ganhar airdrops
Launchpool
Faça staking rapidamente, ganhe potenciais novos tokens
HODLer Airdrop
Detenha GT e obtenha airdrops maciços de graça
Pre-IPOs
Desbloquear acesso completo a IPO de ações globais
Pontos Alpha
Negoceie ativos on-chain para airdrops
Pontos de futuros
Ganhe pontos de futuros e receba recompensas de airdrop
Investimento
Simple Earn
Ganhe juros com tokens inativos
Investimento automático
Invista automaticamente de forma regular.
Investimento Duplo
Aproveite a volatilidade do mercado
Soft Staking
Ganhe recompensas com staking flexível
Empréstimo de criptomoedas
0 Fees
Dê em garantia uma criptomoeda para pedir outra emprestada
Centro de empréstimos
Centro de empréstimos integrado
a xAI lança APIs de fala Grok, oferecendo preços 60% inferiores aos concorrentes
Zach Anderson
Apr 18, 2026 00:53
Elon Musk’s xAI lança APIs de Voz para Texto e Texto para Voz a $0,10/hora, alegando as taxas de erro mais baixas em benchmarks de transcrição empresarial.
Elon Musk’s xAI lançou duas APIs de áudio independentes a 17 de abril, posicionando a tecnologia de fala do Grok como concorrente direto da ElevenLabs, Deepgram e AssemblyAI a preços agressivos.
A API de Voz para Texto do Grok funciona a $0,10 por hora para processamento em lote e $0,20 por hora para streaming em tempo real. Texto para Voz custa $4,20 por milhão de caracteres. Ambas utilizam a mesma infraestrutura que alimenta veículos Tesla e suporte ao cliente Starlink.
Reclamações de Benchmark que Merecem Análise
As taxas de erro de palavra publicadas pela xAI contam uma história interessante. Na reconhecimento de entidades em chamadas telefónicas—como nomes, números de conta, datas—o Grok STT afirma uma taxa de erro de 5,0% versus 12,0% da ElevenLabs, 13,5% da Deepgram e 21,3% da AssemblyAI. Isso representa uma diferença significativa se se confirmar em produção.
A empresa demonstrou isso com um caso de teste complicado: transcrever nomes galês como “Anghared Llewelyn Bowen” e “Oisin MacGiolla Phadraig” juntamente com detalhes de hipotecas. O Grok acertou sem erros. Modelos concorrentes tiveram dificuldades com pronúncias e datas formatadas de forma inconsistente.
A transcrição de vídeos e podcasts mostra uma competição mais acirrada—Grok e ElevenLabs empataram com uma taxa de erro de 2,4%, enquanto Deepgram e AssemblyAI ficaram ligeiramente atrás com 3,0% e 3,2%, respetivamente.
Recursos Técnicos para Desenvolvedores
Para além da transcrição bruta, a xAI integrou funcionalidades que os clientes empresariais realmente precisam: marcas de tempo ao nível de palavra, diarização de falantes em múltiplos canais de áudio e suporte a mais de 25 línguas com troca fluida.
A funcionalidade de Normalização de Texto Inversa converte automaticamente números falados, datas e moedas em formatos corretos. “Four one four five five five one two three four” torna-se um número de telefone. “Six ninety-nine” torna-se $6,99. Pequeno detalhe, mas elimina dores de cabeça na pós-processamento.
Texto para Voz inclui tags inline para controlo de prosódia—sussurros, risos, suspiros, ênfase, ajustes de ritmo. Os desenvolvedores podem inserir nuances emocionais sem lidar com marcações de áudio complexas.
Contexto Estratégico
Este lançamento sucede à aquisição da xAI pela X Corp em março de 2025 e ocorre num momento em que a empresa expande suas parcerias de infraestrutura. Apenas dois dias antes do anúncio da API, surgiram relatos de que a xAI planeja fornecer poder computacional à Cursor, a startup de codificação alimentada por IA.
O supercomputador Colossus, operacional desde dezembro de 2024, fornece a potência de backend. A xAI parece estar monetizando essa capacidade em vários setores—IA empresarial, ferramentas para desenvolvedores e agora APIs de voz.
Para desenvolvedores que criam agentes de voz ou ferramentas de transcrição, os preços são substancialmente inferiores aos dos players estabelecidos. Se as alegações de precisão do Grok sobreviverem à implementação em escala real permanece a questão em aberto. A documentação e os limites de taxa estão disponíveis através do console de APIs da xAI para quem estiver pronto para testar.
Fonte da imagem: Shutterstock