Alibaba ouvre la prochaine génération de flagship Qwen3.6-Max-Preview, axée sur la programmation d'agents intelligents

robot
Création du résumé en cours
ME News Actualités, le 20 avril (UTC+8), selon la surveillance de Dongcha Beating, l'équipe de Alibaba Qianwen a publié Qwen3.6-Max-Preview, positionné comme une version préliminaire de la prochaine génération de modèle phare, succédant à Qwen3.6-Plus existant. Les utilisateurs peuvent interagir directement via Qwen Studio (chat.qwen.ai), puis accéder à l'API via Alibaba Cloud Bailian avec le nom de modèle qwen3.6-max-preview ; l'interface est compatible avec les normes de complétions de chat et de réponses d'OpenAI ainsi que le protocole d'Anthropic.
Cette version est principalement axée sur la programmation d'agents intelligents, permettant au modèle d'écrire du code, de l'exécuter, de voir les erreurs, d'appeler des outils, et d'accomplir des tâches de programmation en plusieurs étapes comme un programmeur.
Les améliorations par rapport à la précédente Qwen3.6-Plus se concentrent principalement sur la programmation : SkillsBench +9,9, SciCode +10,8, NL2Repo +5,0, Terminal-Bench 2.0 +3,8 points ; la connaissance du monde et le format d'appel aux outils suivent également trois autres aspects avec des améliorations de 2,3 à 5,3 points.
L'équipe affirme avoir obtenu les scores les plus élevés sur six benchmarks de programmation tels que SWE-bench Pro, Terminal-Bench 2.0, SciCode, dont QwenClawBench et QwenWebBench, qui semblent être des ensembles d’évaluation internes à Qwen, distincts des benchmarks publics.
Côté API, une nouvelle option appelée preserve_thinking a été ajoutée : lorsqu'elle est activée, le message conserve le contenu de la réflexion des premières tours.
Le modèle de raisonnement ne renvoie par défaut qu'une seule fois la « réflexion de cette tour », ce qui peut poser problème dans une conversation multi-tours où le contexte manque des réflexions précédentes, rendant le modèle susceptible de revenir en arrière ou d'oublier ce qu'il a déjà essayé.
Ce commutateur comble cette lacune.
(Source : BlockBeats)
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé