Google Traducción mejorada: Gemini 3.5 hace que la interpretación de voz en tiempo real ya no tenga pausas incómodas

Google anuncia el lanzamiento de Gemini 3.5 Live Translate, un modelo de voz en tiempo real que puede traducir simultáneamente más de 70 idiomas, preservando el tono y el ritmo del hablante, y que ya está disponible en vista previa para desarrolladores, en la versión empresarial de Meet y en la aplicación Google Translate.
(Resumen previo: Google abre oficialmente la traducción en tiempo real para todas las marcas de auriculares: más de 70 idiomas en línea, Android en EE. UU., México e India como pioneros)
(Información adicional: El abogado Lin Shanglun escribe sobre esto》Cuando preguntas qué comerás al mediodía a la IA, el mundo está reconfigurando su mapa energético en respuesta a esa pregunta)

Un billón de palabras al mes. Este es el volumen de procesamiento de Google Translate hoy, y también el resultado de veinte años de desarrollo. El 9 de junio, Google anunció en su blog oficial la última versión del modelo de audio de Gemini Live API: Gemini 3.5 Live Translate. Su único objetivo es que el idioma deje de ser una pausa en la conversación.

El comienzo y el fin de un billón de palabras

El núcleo de Gemini 3.5 Live Translate es la traducción «de voz a voz», que requiere mantener el tono (entonación), el ritmo (pacing) y el tono (pitch) del hablante.

Los sistemas anteriores esperaban a que el hablante terminara una oración para comenzar la traducción, lo que fragmentaba completamente el ritmo del diálogo. Gemini 3.5 Live Translate utiliza un método de «generación continua», ajustándose en tiempo real entre «esperar más contexto para mejorar la precisión» y «reproducir inmediatamente para seguir el ritmo del hablante», con una diferencia total de solo unos segundos, y detectando automáticamente más de 70 idiomas sin necesidad de cambiar manualmente.

Google ha abierto simultáneamente tres vías: vista previa pública para desarrolladores a través de Gemini Live API y Google AI Studio; vista previa privada para empresas en Google Meet desde este mes; y una actualización global en la aplicación Google Translate en Android y iOS.

Android también ha añadido un «modo escucha», que permite colocar el teléfono cerca del oído y escuchar la traducción en el altavoz del auricular, sin necesidad de auriculares ni molestar a los demás, ideal para escuchar guías en idiomas extranjeros en museos o atender llamadas en idiomas en lugares silenciosos.

La vía de distribución es la verdadera barrera

La traducción de voz en tiempo real no es exclusiva de Google. Meta con SeamlessM4T, Samsung con la traducción en llamadas en Galaxy AI, Apple con Live Translation, y OpenAI con su API en tiempo real, ya tienen competidores con tecnología y capital suficientes en esta carrera.

La diferencia está en la distribución. La app Google Translate tiene mil millones de usuarios activos mensuales, la penetración de Google Meet en el mercado empresarial es sólida, y la cantidad de dispositivos Android en todo el mundo garantiza un alcance amplio. Cada nueva función se actualiza directamente en herramientas que ya usan miles de millones de personas, sin necesidad de que descarguen una app adicional.

El caso de Grab ilustra cuán real es esta barrera. Esta plataforma de transporte y delivery en el sudeste asiático está probando que conductores y pasajeros puedan comunicarse en múltiples idiomas en tiempo real mediante Gemini 3.5 Live Translate. Los usuarios de Grab realizan más de 10 millones de llamadas de voz mensuales a través de su plataforma, lo que significa que en un mercado con una fragmentación lingüística tan alta (tailandés, vietnamita, malayo, indonesio, filipino), la interpretación en tiempo real pasa de ser una función adicional a convertirse en una infraestructura básica.

Socios tempranos como CJ ENM y LiveKit también han reportado que la calidad, precisión y latencia de las traducciones cumplen con las expectativas.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado