Alibaba Qianwen Modèle Multimodal Complet Qwen3.5-Omni lancé

robot
Création du résumé en cours

Message de TechFlow Deep Tide, le 30 mars, selon les données de Jin10, Alibaba Qianwen a annoncé le lancement du modèle génératif tout-modal Qwen3.5-Omni. La série Qwen3.5-Omni comprend des versions Instruct de trois tailles : Plus, Flash et Light, et prend en charge un contexte long de 256k. Le modèle prend en charge des entrées audio de plus de 10 heures ainsi que des entrées vidéo et audio 720P (1FPS) de plus de 400 secondes. Le modèle est entraîné nativement en apprentissage multi-modal sur de vastes ensembles de données textuelles, visuelles et vidéo/audio dépassant 100 millions d’heures ; ce modèle fait preuve de capacités remarquables d’analyse et de génération tout-modal. Par rapport à Qwen3-Omni, les capacités multilingues de Qwen3.5-Omni sont nettement renforcées : il peut prendre en charge la reconnaissance vocale dans 113 langues et dialectes ainsi que la génération vocale dans 36 langues et dialectes.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler