Alibaba lança a nova geração de modelo multimodal Qwen3.5-Omni

robot
Geração de resumo em curso

30 de março, a Alibaba lançou o Qwen3.5-Omni, o novo modelo de linguagem multimodal de geração completa Qwen de próxima geração, alcançando o SOTA (melhor desempenho) em 215 tarefas, incluindo compreensão, reconhecimento e interação de áudio e vídeo, ultrapassando o Gemini-3.1 Pro e tornando-se um dos modelos multimodais de geração completa mais fortes do mundo atualmente. O novo modelo possui capacidades extremamente avançadas de compreensão de áudio e vídeo e de interação em tempo real, consegue gerar descrições estruturadas detalhadas e controláveis a partir de conteúdos de áudio e vídeo, reconhece até 113 línguas e dialetos, e, como surpresa, também emergiu com a capacidade de Vibe Coding de áudio e vídeo.

Atualmente, o Alibaba Cloud Bailian acaba de lançar três tipos de API do Qwen3.5-Omni: Plus, Flash e Light, que podem ser amplamente aplicados em indústrias como plataformas de vídeo curto/streaming ao vivo, jogos e criadores de conteúdo. Os utilizadores comuns também podem experimentar gratuitamente no Qwen Chat; os desenvolvedores e empresas podem acionar o modelo Qwen3.5-Omni através da plataforma Alibaba Cloud Bailian, com um custo de menos de 0,8 yuans por milhão de Tokens de entrada.

(Fonte: Notícias da Economia Diária)

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar