AIMPACT Actualités, 20 mai (UTC+8), selon la surveillance de Beating, Alibaba Tongyi Qianwen a officiellement lancé la nouvelle base de l'agent intelligent phare Qwen3.7-Max. Les données de performance publiées officiellement montrent que, sans aucun document d'architecture de puce ni données d'analyse de performance, le nouveau modèle a réussi à augmenter de 10,0 fois les performances de l'opérateur Triton du processeur domestique Pingtouge Zhenwu M890 lors d'une tâche d'optimisation autonome du noyau durant 35 heures avec 1158 appels d'outils. Au cours du processus d'optimisation, le modèle a traversé cinq étapes de développement clés. Il a d'abord divisé le préfixe KV-cache le long de la dimension des tokens en utilisant la partition Split-K pour remplir les 36 cœurs SM ; ensuite, il a remplacé le cudaMalloc synchrone entre l'hôte et le dispositif par une variable PyTorch pré-allouée, et en utilisant les métadonnées tensor, il a complètement éliminé l'action synchrone cudaMemcpy lors de l'interrogation de la longueur du préfixe, supprimant ainsi entièrement les frais de communication entre l'hôte et le dispositif ; dans la dernière étape, le modèle a restructuré l'opérateur pour traiter simultanément les 4 tokens de requête dans un seul bloc de threads, partageant les charges pour amortir les frais d'accès mémoire, réalisant une restructuration spécialisée au niveau architectural. Les mesures de performance de l'opérateur optimisé montrent que Qwen3.7-Max atteint un ratio d'accélération géométrique moyen de 10,0x, surpassant nettement GLM 5.1 (7,3x) et Kimi K2.6 (5,0x). DeepSeek V4 Pro n'a que 3,3x et a volontairement terminé la tâche plus tôt dans la seconde moitié en raison de l'absence d'appels d'outils pendant cinq tours consécutifs. Afin de maîtriser des stratégies de résolution de problèmes universelles dans des environnements variés, Qwen3.7-Max a découplé la tâche, le cadre d'exécution et le validateur lors de l'entraînement, et a évité le surapprentissage des raccourcis spécifiques aux références grâce à un apprentissage par renforcement cross-cadre. Sur les références générales d'agents MCP-Mark (60,8 points) et SpreadSheetBench (87,0 points), Qwen3.7-Max a montré une très forte généralisation, ses performances globales se rapprochant de Claude-4.6-Opus-Max. (Source : BlockBeats)

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

Récompense
J'aime
Commentaire
Reposter
Partager

Commentaire

Ajouter un commentaire

Aucun commentaire

Sujets populaires
Afficher plus
#
SKHynixTopsKOSPIByMarketCap
1,47M Popularité
#
BTCProbes60KKeySupportLevel
329,04M Popularité
#
IsraelStrikesIranBTCPlunges
62,8K Popularité
#
WorldCup🏴󠁧󠁢󠁳󠁣󠁴󠁿vs🇧🇷
292,76K Popularité
#
TradFiCFDGoldMaster
2,18M Popularité

Épinglé

Lancement officiel de Qwen3.7-Max : écriture autonome de code 1158 fois en 35 heures, développement d'un opérateur d'accélération 10x sur une puce nationale.

Sujets populaires

SKHynixTopsKOSPIByMarketCap

BTCProbes60KKeySupportLevel

IsraelStrikesIranBTCPlunges

WorldCup🏴󠁧󠁢󠁳󠁣󠁴󠁿vs🇧🇷

TradFiCFDGoldMaster

Épinglé