تم إصدار أول نموذج عالمي أصلي للغة من نوع Qwen-AgentWorld بواسطة Tongyi Qianwen

ME AI رسالة، وفقًا لمراقبة Beating، أطلقت فريق Tongyi Qianwen اليوم رسميًا Qwen-AgentWorld، وهو أول نموذج عالمي لغوي أصلي يدمج نمذجة البيئة كهدف تدريبي منذ مرحلة التدريب المسبق المستمر، وليس مجرد تكييف لاحق لنموذج عام كبير. يغطّي هذا النموذج في إطار واحد بيئات نصية (MCP، Search، Terminal، SWE) وبيئات واجهة المستخدم الرسومية (Web، OS، Android) في سبعة مجالات، ويعتمد على أكثر من 10 ملايين مسار تفاعل حقيقي مع البيئة، ومرّ بثلاث مراحل تدريبية هي CPT→SFT→RL، لتحقيق نقل المعرفة عبر المجالات. كما تم إصدار معيار تقييم AgentWorldBench بشكل مفتوح المصدر، حيث يتضمن كل عينة اختبار بيانات ملاحظة من البيئة الحقيقية، وقد تم إطلاق النموذج ومعيار التقييم على Hugging Face و ModelScope. في تقييم AgentWorldBench، حقق Qwen-AgentWorld-397B-A17B أعلى جودة محاكاة شاملة، متفوقًا على GPT-5.4، وClaude Opus 4.8، وGemini 3.1 Pro. كما استكشف فريق البحث مسارين لتطبيق نمذجة العالم في تدريب الوكيل الذكي: كمحاكي بيئة مفصول يمكن التحكم فيه، حيث يمكن لمحاكاة RL أن تشكل سلوك الوكيل وتتفوق بشكل ملحوظ على RL المدرب فقط في البيئة الحقيقية؛ وكنموذج أساسي موحد للوكيل الذكي، حيث يمكن لعملية التهيئة المسبقة لنموذج LWM أن تنتقل إلى مهام الوكيل الذكي متعددة الأدوار التي تغطي سبعة معايير، منها ثلاثة معايير لم تظهر في مجموعة التدريب على الإطلاق، وبدون الحاجة إلى ضبط RL لمهام الوكيل، مما يثبت بشكل أولي إمكانات نموذج العالم اللغوي كنموذج أساسي أقوى للوكيل الذكي. اضغط على الرابط أدناه للنسخة الأصلية، وانضم إلى قناة Beating · Feishu للأخبار الذكية، لمراقبة أخبار ومواضيع الذكاء الاصطناعي العالمية على مدار 24 ساعة. (المصدر: BlockBeats)
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت