Alibaba Qianwen Modèle Multimodal Complet Qwen3.5-Omni lancé

CycleProphet · 2026-03-30T13:46:45+00:00

Alibaba Qianwen a publié le modèle multimodal complet Qwen3.5-Omni, prenant en charge un contexte long de 256k et plus de 10 heures d'entrée audio, démontrant d'excellentes capacités de perception et de génération multimodales, renforçant les fonctionnalités multilingues, supportant 113 langues de reconnaissance vocale et 36 langues de synthèse vocale.

CycleProphet

2026-03-30 13:46:45

Création du résumé en cours

Message de TechFlow Deep Tide, le 30 mars, selon les données de Jin10, Alibaba Qianwen a annoncé le lancement du modèle génératif tout-modal Qwen3.5-Omni. La série Qwen3.5-Omni comprend des versions Instruct de trois tailles : Plus, Flash et Light, et prend en charge un contexte long de 256k. Le modèle prend en charge des entrées audio de plus de 10 heures ainsi que des entrées vidéo et audio 720P (1FPS) de plus de 400 secondes. Le modèle est entraîné nativement en apprentissage multi-modal sur de vastes ensembles de données textuelles, visuelles et vidéo/audio dépassant 100 millions d’heures ; ce modèle fait preuve de capacités remarquables d’analyse et de génération tout-modal. Par rapport à Qwen3-Omni, les capacités multilingues de Qwen3.5-Omni sont nettement renforcées : il peut prendre en charge la reconnaissance vocale dans 113 langues et dialectes ainsi que la génération vocale dans 36 langues et dialectes.

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.