Alibaba a lancé un modèle IA « compact » pour les smartphones
Le géant technologique chinois Alibaba Cloud a lancé le modèle IA multimodal Qwen2.5-Omni-7B, capable de traiter du texte, des images, de l'audio, de la vidéo, ainsi que de générer des réponses textuelles et vocales en temps réel.
Le réseau de neurones possède 7 milliards de paramètres. Selon les représentants de l'entreprise, il peut être exécuté sur des appareils périphériques tels que des téléphones et des ordinateurs portables sans perte d'efficacité ni de performance.
«Cette combinaison unique fait du modèle une base idéale pour le développement d'agents IA flexibles et rentables, qui apportent un bénéfice tangible, en particulier les applications vocales intelligentes», indique l'annonce.
À titre d'exemple des applications de Qwen2.5-Omni-7B, l'entreprise a évoqué l'amélioration de la vie des personnes malvoyantes. Grâce à elle, elles peuvent mieux s'orienter dans leur environnement. Ainsi, le modèle est capable d'analyser les ingrédients disponibles à partir de vidéos et de proposer un guide étape par étape pour la préparation des repas.
«Qwen2.5-Omni-7B offre des performances étonnantes dans toutes les modalités, rivalisant avec des modèles spécialisés de taille comparable», a souligné la société
L'innovation s'explique par une nouvelle architecture et un ensemble de données de haute qualité qui ont été utilisés pour l'apprentissage.
Comparaison des performances de Qwen2.5-Omni-7B avec ses concurrents. Données : Alibaba Cloud. Le modèle est open source et disponible sur Hugging Face, GitHub, ModelScope et Qwen Chat.
Rappelons qu'en mars, Alibaba a présenté le modèle d'IA orienté vers la réflexion QwQ-32.
En janvier, le géant technologique chinois a présenté Qwen 2.5-Max, qui serait prétendument plus puissant que DeepSeek-V3.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Alibaba a lancé un modèle d'IA «compact» pour les smartphones.
Alibaba a lancé un modèle IA « compact » pour les smartphones
Le géant technologique chinois Alibaba Cloud a lancé le modèle IA multimodal Qwen2.5-Omni-7B, capable de traiter du texte, des images, de l'audio, de la vidéo, ainsi que de générer des réponses textuelles et vocales en temps réel.
Le réseau de neurones possède 7 milliards de paramètres. Selon les représentants de l'entreprise, il peut être exécuté sur des appareils périphériques tels que des téléphones et des ordinateurs portables sans perte d'efficacité ni de performance.
À titre d'exemple des applications de Qwen2.5-Omni-7B, l'entreprise a évoqué l'amélioration de la vie des personnes malvoyantes. Grâce à elle, elles peuvent mieux s'orienter dans leur environnement. Ainsi, le modèle est capable d'analyser les ingrédients disponibles à partir de vidéos et de proposer un guide étape par étape pour la préparation des repas.
L'innovation s'explique par une nouvelle architecture et un ensemble de données de haute qualité qui ont été utilisés pour l'apprentissage.
Rappelons qu'en mars, Alibaba a présenté le modèle d'IA orienté vers la réflexion QwQ-32.
En janvier, le géant technologique chinois a présenté Qwen 2.5-Max, qui serait prétendument plus puissant que DeepSeek-V3.