Deep潮 TechFlow 消息,4 月 30 日,阿里千问宣布开源 Qwen-Scope——基于 Qwen3 系列和 Qwen3.5 系列模型训练所得的可解释性模块,应用场景包括推理结果定向控制、数据分类与合成、模型训练与优化、评估样本分布分析与对比等。本次 Qwen-Scope 开源的权重涉及 7 个大模型,覆盖 Qwen3及 Qwen3.5 系列的稠密模型和混合专家模型,共有 14 组稀疏自编码器权重。(金十)

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé