Google Tradutor atualizado: Gemini 3.5 torna a interpretação de voz ao vivo sem pausas embaraçosas

Google anuncia o lançamento do Gemini 3.5 Live Translate, um modelo de tradução de voz em tempo real que consegue sincronizar a tradução de mais de 70 idiomas, preservando o tom e o ritmo do falante, e já está disponível em pré-visualização para desenvolvedores, na versão empresarial do Meet e no Google Tradutor App.
(Contexto anterior: Google traduz em tempo real oficialmente para todas as marcas de fones de ouvido: mais de 70 idiomas disponíveis, lançamento primeiro para smartphones Android nos EUA, México e Índia)
(Informação adicional: Advogado Lin Shanglun escreve sobre isso》Quando perguntas ao AI o que comer ao meio-dia, o mundo está reconfigurando seu mapa energético em resposta a essa questão)

Um trilhão de palavras por mês. Essa é a capacidade de processamento do Google Tradutor hoje, resultado de vinte anos de desenvolvimento. Em 9 de junho, o Google anunciou em seu blog oficial o lançamento do mais recente modelo de áudio da API Gemini Live: Gemini 3.5 Live Translate. Seu objetivo é único: fazer com que a linguagem deixe de ser uma pausa na conversa.

O ponto de partida e de chegada de um trilhão de palavras

O núcleo do Gemini 3.5 Live Translate é a tradução "de voz para voz", com a exigência de preservar a entonação, o ritmo e o tom do falante.

Sistemas anteriores precisavam esperar o falante terminar uma frase para começar a traduzir, com pausas que fragmentavam completamente o ritmo do diálogo. O Gemini 3.5 Live Translate usa uma abordagem de "geração contínua", ajustando em tempo real entre "esperar mais contexto para melhorar a precisão" e "produzir imediatamente para acompanhar o falante", com uma diferença total de apenas alguns segundos, além de detectar automaticamente mais de 70 idiomas, sem necessidade de troca manual.

O Google disponibiliza simultaneamente três canais de acesso: pré-visualização pública para desenvolvedores via Gemini Live API e Google AI Studio; uma pré-visualização privada para empresas no Google Meet a partir deste mês; e uma atualização global do Google Tradutor App para Android e iOS.

O Android também ganhou um "modo de escuta", que, ao aproximar o telefone do ouvido, reproduz a tradução de voz pelo alto-falante, sem necessidade de fones de ouvido e sem incomodar os ao redor, ideal para ouvir guias em línguas estrangeiras em museus ou atender chamadas em línguas estrangeiras em ambientes silenciosos.

Canal de distribuição é a verdadeira barreira

A tradução de voz em tempo real não é exclusividade do Google. Meta com SeamlessM4T, Samsung com AI de chamadas em tempo real no Galaxy, Apple com Live Translation, OpenAI com API de tradução em tempo real — esse mercado já está cheio de concorrentes com tecnologia e capital suficientes.

A diferença está na distribuição. O aplicativo Google Tradutor tem bilhões de usuários ativos mensais, o Google Meet já possui uma penetração consolidada no mercado corporativo, e a quantidade de dispositivos Android vendidos globalmente garante alcance. Cada nova funcionalidade é atualizada diretamente nas ferramentas que bilhões já usam, sem exigir que instalem um aplicativo adicional.

O caso da Grab demonstra o quão real essa barreira de distribuição é. Essa plataforma de transporte e delivery do Sudeste Asiático está testando uma comunicação multilíngue em tempo real entre motoristas e passageiros usando o Gemini 3.5 Live Translate. Os usuários da Grab fazem mais de 10 milhões de chamadas de voz por mês na plataforma, o que significa que, em um mercado altamente fragmentado linguística e culturalmente (com tailandês, vietnamita, malaio, indonésio, filipino misturados), a tradução instantânea passa de uma funcionalidade adicional para uma infraestrutura básica.

Parceiros iniciais como CJ ENM e LiveKit também relataram que a qualidade, precisão e latência das traduções estão atendendo às expectativas.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado