Google lança o modelo de áudio ao vivo Gemini 3.1 Flash para desenvolvedores

robot
Geração de resumo em curso

Investing.com - O Google anunciou na quinta-feira o lançamento do Gemini 3.1 Flash Live, um novo modelo de áudio e voz projetado para oferecer conversas em tempo real com maior precisão e menor latência. Atualmente, o modelo está disponível em pré-visualização para desenvolvedores através da Gemini Live API no Google AI Studio, para empresas via Gemini Enterprise for Customer Experience, e para consumidores através do Search Live e Gemini Live.

O modelo obteve uma pontuação de 90,8% no benchmark ComplexFuncBench Audio, que avalia a capacidade de realizar chamadas de funções com múltiplos passos sob restrições. No teste Audio MultiChallenge da Scale AI, que mede a capacidade de seguir comandos complexos e raciocínio de longo prazo em ambientes de áudio com interferências do mundo real, o Gemini 3.1 Flash Live alcançou 36,1% de pontuação após ativar a funcionalidade de “pensamento”.

Várias empresas, incluindo Verizon (NYSE:VZ), LiveKit e The Home Depot (NYSE:HD), forneceram feedback positivo sobre o desempenho do modelo em seus fluxos de trabalho. O modelo apresenta uma compreensão aprimorada de entonação, podendo identificar nuances acústicas como tom e ritmo, além de ajustar dinamicamente suas respostas com base na expressão de frustração ou confusão do usuário.

Nos aplicativos para consumidores, o Gemini Live oferece respostas mais rápidas do que o modelo anterior e mantém o contexto da conversa por o dobro do tempo. O modelo 3.1 Flash Live suporta a expansão global do Search Live, que já está disponível em mais de 200 países e regiões com suporte multilíngue.

Todos os áudios gerados pelo 3.1 Flash Live contêm uma marca d’água SynthID, uma marca imperceptível embutida na saída de áudio para identificar conteúdos gerados por IA. A Google afirma que essa tecnologia de marca d’água visa ajudar a prevenir a disseminação de informações falsas.

Esta tradução foi assistida por inteligência artificial. Para mais informações, consulte nossos termos de uso.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar