Alibaba ouvre la prévisualisation de la prochaine génération de flagship Qwen3.6-Max, axée sur la programmation intelligente

robot
Création du résumé en cours
ME News Actualités, le 20 avril (UTC+8), selon la surveillance de Dongcha Beating, l'équipe de Alibaba Qianwen a publié Qwen3.6-Max-Preview, positionné comme une version préliminaire de la prochaine génération de modèle phare, succédant à Qwen3.6-Plus existant. Les utilisateurs peuvent interagir directement via Qwen Studio (chat.qwen.ai), puis accéder à l'API via Alibaba Cloud Bailian avec le nom de modèle qwen3.6-max-preview ; l'interface est compatible avec les normes de complétions de chat et de réponses d'OpenAI ainsi que le protocole d'Anthropic.
Cette version est principalement axée sur la programmation d'agents intelligents, permettant au modèle d'écrire du code, de l'exécuter, de voir les erreurs, d'appeler des outils, et d'accomplir des tâches de programmation en plusieurs étapes comme un programmeur.
Les améliorations par rapport à la précédente Qwen3.6-Plus se concentrent principalement sur la programmation : SkillsBench +9,9, SciCode +10,8, NL2Repo +5,0, Terminal-Bench 2.0 +3,8 points ; la connaissance du monde et le format d'appel aux outils suivent également trois autres aspects avec des améliorations de 2,3 à 5,3 points.
L'équipe affirme avoir obtenu les scores les plus élevés sur six benchmarks de programmation tels que SWE-bench Pro, Terminal-Bench 2.0, SciCode, où QwenClawBench et QwenWebBench, du nom, semblent être des ensembles d’évaluation internes à Qianwen, distincts des benchmarks publics.
Côté API, une nouvelle option appelée preserve_thinking a été ajoutée : lorsqu'elle est activée, le message conserve le contenu de la réflexion des premières tours.
Le modèle de raisonnement ne renvoie par défaut que « la réflexion de cette tour » à chaque étape ; dans une conversation multi-tours avec un agent intelligent, le contexte peut manquer des réflexions précédentes, ce qui peut faire que le modèle se replie sur ses pas ou oublie ce qu'il a déjà essayé lors de la replanification.
Ce commutateur comble cette lacune.
(Source : BlockBeats)
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé