通义千问は最初のネイティブ言語世界モデルQwen-AgentWorldをリリースしました

ME AI メッセージによると、動察 Beating 監測によると、通義千問チームは本日、Qwen-AgentWorldを正式にリリースしました。これは、環境モデリングを事前学習の段階から訓練目標として設定した最初のネイティブな言語世界モデルであり、汎用大規模モデルへの後付け適応ではありません。このモデルは、単一のフレームワーク下で、テキストタイプの環境(MCP、Search、Terminal、SWE)とGUIタイプの環境(Web、OS、Android)の7つの主要分野を同時にカバーし、実環境のインタラクション軌跡1000万以上に基づいて、CPT→SFT→RLの3段階の訓練を経て、分野横断の知識移転を実現しました。同時にオープンソース化されたAgentWorldBench評価基準も公開されており、各テストサンプルには実環境から得られた観測データが付属しています。モデルと評価基準はHugging FaceとModelScopeにて公開されています。 AgentWorldBench評価において、Qwen-AgentWorld-397B-A17Bは最高の総合模擬品質を達成し、GPT-5.4、Claude Opus 4.8、Gemini 3.1 Proを超えました。研究チームはまた、世界モデリングのスマートエージェント訓練における2つの応用パスを探究しています。1つは、デカップリングされた環境シミュレーターとして、制御可能なシミュレーションRLがスマートエージェントの行動を形成し、実環境のみで訓練されたRLよりも顕著に優れること。もう1つは、統一されたスマートエージェントの基盤モデルとして、LWMの事前訓練を通じて7つの基準をカバーする多ターンのスマートエージェントタスクに移行可能であり、そのうち3つの基準は訓練データセットに全く含まれておらず、スマートエージェントタスクのRL微調整も不要です。これにより、言語世界モデルがより強力なスマートエージェントの基盤モデルとしての潜在能力を初期段階で検証しました。 下の原文リンクをクリックして、動察 Beating · 飞书 AI ニュースチャンネルに参加し、24時間体制で世界のAIホットトピックとニュースを監視しましょう。(出典:BlockBeats)
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし