Alibaba lançou um modelo de IA "compacto" para execução em smartphones
O gigante tecnológico chinês Alibaba Cloud lançou o modelo de IA multimodal Qwen2.5-Omni-7B, capaz de processar texto, imagens, áudio, vídeo, assim como gerar respostas textuais e de voz em tempo real.
A rede neural possui 7 bilhões de parâmetros. Segundo representantes da empresa, ela pode ser executada em dispositivos periféricos como telefones e laptops sem perda de eficiência e desempenho.
"Esta combinação única torna o modelo a base ideal para o desenvolvimento de agentes de IA flexíveis e economicamente eficientes, que trazem benefícios significativos, especialmente aplicações de voz inteligentes", diz o anúncio
Como exemplo das aplicações do Qwen2.5-Omni-7B, a empresa mencionou a melhoria da vida das pessoas com deficiência visual. Com a ajuda dele, elas podem se orientar melhor no ambiente ao seu redor. Assim, o modelo é capaz de analisar os ingredientes disponíveis por meio de vídeo e oferecer um guia passo a passo para o preparo da comida.
«Qwen2.5-Omni-7B oferece um desempenho impressionante em todas as modalidades, competindo com modelos especializados de tamanho comparável», destacou a empresa
A inovação é explicada pela nova arquitetura e pelo conjunto de dados de alta qualidade que foram utilizados para o treinamento.
Comparação de desempenho Qwen2.5-Omni-7B com concorrentes. Dados: Alibaba Cloud. O modelo tem código aberto e está disponível no Hugging Face, GitHub, ModelScope e Qwen Chat.
Recordamos que, em março, a Alibaba apresentou o modelo de IA QwQ-32 orientado para raciocínios.
Em janeiro, o gigante tecnológico chinês apresentou o Qwen 2.5-Max, que supostamente é mais potente que o DeepSeek-V3.
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
Alibaba lançou um modelo de IA "compacto" para execução em smartphones
Alibaba lançou um modelo de IA "compacto" para execução em smartphones
O gigante tecnológico chinês Alibaba Cloud lançou o modelo de IA multimodal Qwen2.5-Omni-7B, capaz de processar texto, imagens, áudio, vídeo, assim como gerar respostas textuais e de voz em tempo real.
A rede neural possui 7 bilhões de parâmetros. Segundo representantes da empresa, ela pode ser executada em dispositivos periféricos como telefones e laptops sem perda de eficiência e desempenho.
Como exemplo das aplicações do Qwen2.5-Omni-7B, a empresa mencionou a melhoria da vida das pessoas com deficiência visual. Com a ajuda dele, elas podem se orientar melhor no ambiente ao seu redor. Assim, o modelo é capaz de analisar os ingredientes disponíveis por meio de vídeo e oferecer um guia passo a passo para o preparo da comida.
A inovação é explicada pela nova arquitetura e pelo conjunto de dados de alta qualidade que foram utilizados para o treinamento.
Recordamos que, em março, a Alibaba apresentou o modelo de IA QwQ-32 orientado para raciocínios.
Em janeiro, o gigante tecnológico chinês apresentou o Qwen 2.5-Max, que supostamente é mais potente que o DeepSeek-V3.