Tongyi Qianwen merilis model bahasa dunia asli pertamanya Qwen-AgentWorld

ME AI Pesan, menurut pemantauan Beating, tim Tongyi Qianwen hari ini secara resmi merilis Qwen-AgentWorld, ini adalah model dunia bahasa asli pertama yang menetapkan pemodelan lingkungan sebagai tujuan pelatihan sejak tahap pra-pelatihan lanjutan, bukan hanya adaptasi akhir dari model besar umum. Model ini mencakup secara bersamaan dalam satu kerangka kerja lingkungan berbasis teks (MCP, Search, Terminal, SWE) dan lingkungan berbasis GUI (Web, OS, Android) dengan total tujuh bidang, berdasarkan lebih dari 10 juta jejak interaksi lingkungan nyata, melalui tiga tahap pelatihan CPT→SFT→RL, mencapai transfer pengetahuan lintas bidang. Secara bersamaan juga dirilis open source benchmark evaluasi AgentWorldBench, setiap sampel pengujian dilengkapi dengan data observasi yang diperoleh dari eksekusi lingkungan nyata, dan model serta benchmark telah tersedia di Hugging Face dan ModelScope. Dalam evaluasi AgentWorldBench, Qwen-AgentWorld-397B-A17B meraih kualitas simulasi keseluruhan tertinggi, melampaui GPT-5.4, Claude Opus 4.8, dan Gemini 3.1 Pro. Tim peneliti juga mengeksplorasi dua jalur aplikasi pemodelan dunia dalam pelatihan agen cerdas: sebagai simulator lingkungan yang terlepas, simulasi yang dapat dikendalikan dan RL yang dapat membentuk perilaku agen serta secara signifikan lebih unggul daripada RL yang hanya dilatih di lingkungan nyata; sebagai model dasar agen yang terintegrasi, pelatihan pra-pemanasan LWM dapat ditransfer ke tugas agen multi-putaran yang mencakup tujuh benchmark, di mana tiga benchmark sama sekali tidak muncul dalam dataset pelatihan, dan tanpa perlu fine-tuning RL tugas agen, yang secara awal membuktikan potensi model dunia bahasa sebagai model dasar agen yang lebih kuat. Klik tautan asli di bawah ini, bergabunglah dengan saluran berita AI Beating · Feishu, pemantauan nonstop 24/7 terhadap hotspot dan berita AI global. (Sumber: BlockBeats)
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar