Suporta 3500 pares de idiomas! Alibaba lança o primeiro grande modelo de tradução simultânea com realce visual, Qwen3.5-LiveTranslate.

robot
Geração do resumo em andamento
Notícias AIMPACT, 20 de maio (UTC+8), de acordo com o monitoramento do 动察 Beating, o sistema de tradução simultânea está evoluindo de uma tradução de voz monótona para um intérprete digital multimodal que pode entender imagens e clonar vozes.
Em 19 de maio, o Alibaba Tongyi Lab anunciou oficialmente o lançamento do novo grande modelo de tradução simultânea em tempo real de áudio e vídeo Qwen3.5-LiveTranslate, que atualiza significativamente a capacidade de tradução simultânea para mais de 3500 pares de idiomas, e pela primeira vez suporta clonagem de voz em tempo real, personalização de palavras-chave e compreensão visual.
O novo modelo é baseado na arquitetura Qwen3.5-Omni, e agora suporta compreensão e escrita em 60 idiomas, além de saída de voz em 29 idiomas.
Diferente do software de tradução simultânea tradicional que apenas ouve áudio, o novo modelo introduz contexto visual em tempo real para eliminar ambiguidades semânticas. Por exemplo, quando uma máscara específica aparece no vídeo, o sistema pode combinar características visuais para distinguir precisamente entre uma máscara médica e uma máscara de baile de máscaras em inglês, compensando a falta de informações de áudio.
Para eliminar os desvios de transcrição causados por ruído e sotaque, o novo modelo também introduz um mecanismo de injeção dinâmica de palavras-chave. A razão é simples: os usuários podem especificar diretamente nomes de pessoas, marcas ou termos técnicos no fluxo de tradução, forçando a tradução correta e evitando que termos próprios se desviem durante a tradução simultânea.
Na tradução simultânea entre idiomas, o modelo também suporta clonagem de voz em tempo real, sendo capaz de reproduzir em tempo real o timbre e o tom da voz original do falante no fluxo de tradução.
Atualmente, o novo modelo já está disponível na plataforma de experiência Qwen Omni, e no futuro a API estará disponível na plataforma Alibaba Cloud Bailian.
(Fonte: BlockBeats)
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários