Thông Ngữ Thiên Vấn phát hành mô hình ngôn ngữ thế giới nguyên bản đầu tiên Qwen-AgentWorld

ME AI Thông báo, theo theo dõi Beating, nhóm Tongyi Qianwen hôm nay chính thức phát hành Qwen-AgentWorld, đây là mô hình thế giới ngôn ngữ nguyên bản đầu tiên thiết lập mô hình môi trường làm mục tiêu huấn luyện ngay từ giai đoạn tiền huấn luyện tiếp tục, không phải là thích ứng sau cùng của mô hình lớn chung. Mô hình này đồng thời bao phủ bảy lĩnh vực trong một khung framework duy nhất, gồm môi trường dạng văn bản (MCP, Search, Terminal, SWE) và môi trường dạng GUI (Web, OS, Android), dựa trên hơn 10 triệu lượt tương tác môi trường thực tế, trải qua ba giai đoạn huấn luyện CPT→SFT→RL, đạt được chuyển giao kiến thức qua các lĩnh vực. Đồng thời mở mã nguồn cho bộ chuẩn đánh giá AgentWorldBench, mỗi mẫu thử nghiệm đều đi kèm dữ liệu quan sát thu được từ môi trường thực tế, mô hình và bộ chuẩn đã được đưa lên Hugging Face và ModelScope. Trong đánh giá AgentWorldBench, Qwen-AgentWorld-397B-A17B đạt chất lượng mô phỏng tổng thể cao nhất, vượt xa GPT-5.4, Claude Opus 4.8 và Gemini 3.1 Pro. Nhóm nghiên cứu còn khám phá hai hướng ứng dụng của mô hình thế giới trong huấn luyện trí thông minh nhân tạo: như một bộ giả lập môi trường tách rời, có thể kiểm soát để mô phỏng RL hình thành hành vi trí tuệ nhân tạo và vượt trội hơn so với RL huấn luyện chỉ trong môi trường thực; như một mô hình nền tảng trí tuệ nhân tạo thống nhất, huấn luyện tiền huấn luyện LWM có thể chuyển giao sang các nhiệm vụ đa vòng của trí tuệ nhân tạo bao gồm bảy chuẩn, trong đó có ba chuẩn hoàn toàn chưa từng xuất hiện trong tập huấn luyện, và không cần tinh chỉnh RL cho nhiệm vụ trí tuệ nhân tạo, bước đầu xác nhận tiềm năng của mô hình thế giới ngôn ngữ như một nền tảng trí tuệ nhân tạo mạnh mẽ hơn. Nhấn vào liên kết nguyên bản phía dưới để tham gia Beating · kênh tin tức AI của Feishu, theo dõi liên tục 24/7 các điểm nóng và tin tức AI toàn cầu. (Nguồn: BlockBeats)
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim