Tongyi Qianwen a publié le premier modèle de langage natif pour le monde, Qwen-AgentWorld

ME AI Message, selon la surveillance Beating, l'équipe Tongyi Qianwen a officiellement publié aujourd'hui Qwen-AgentWorld, le premier modèle de monde linguistique natif qui intègre la modélisation de l'environnement dès la phase de pré-entraînement continue, et non une adaptation ultérieure à un grand modèle général. Ce modèle couvre simultanément sept grands domaines dans un cadre unique : les environnements textuels (MCP, Search, Terminal, SWE) et les environnements GUI (Web, OS, Android), basé sur plus de 10 millions de trajectoires d'interaction environnementale réelles, et a été entraîné en trois phases CPT→SFT→RL, réalisant un transfert de connaissances inter-domaines. La benchmark d’évaluation AgentWorldBench, également open source, est synchronisée, chaque échantillon de test étant équipé de données d'observation issues de l'exécution dans un environnement réel, et le modèle ainsi que la benchmark sont disponibles sur Hugging Face et ModelScope. Dans l’évaluation AgentWorldBench, Qwen-AgentWorld-397B-A17B a obtenu la meilleure qualité de simulation globale, surpassant GPT-5.4, Claude Opus 4.8 et Gemini 3.1 Pro. L'équipe de recherche a également exploré deux voies d'application de la modélisation du monde dans l'entraînement des agents : en tant que simulateur d’environnement découplé, permettant une simulation contrôlable, le RL peut façonner le comportement de l’agent et surpasser nettement le RL entraîné uniquement dans un environnement réel ; en tant que modèle de base unifié pour les agents, la pré-formation LWM peut être transférée à des tâches multi-agents couvrant sept benchmarks, dont trois ne sont pas apparus dans le jeu de données d’entraînement, sans nécessiter de fine-tuning RL spécifique aux tâches d’agent, validant ainsi le potentiel du modèle de monde linguistique comme base d’agents plus puissants. Cliquez sur le lien ci-dessous pour accéder au texte original, rejoindre le canal d’actualités AI Beating · Feishu, pour une surveillance 24/7 des tendances et actualités mondiales de l’IA. (Source : BlockBeats)
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire