أعلنت علي عن الجيل الجديد من نموذج القالب الذكي 3.5، متصدرًا قائمة أقوى النماذج المفتوحة المصدر على مستوى العالم

robot
إنشاء الملخص قيد التقدم

في يوم عيد الربيع في 16 فبراير، أطلقت شركة علي بابا نموذجها الكبير الجديد من الجيل التالي، Qwen3.5-Plus، وهو نموذج مفتوح المصدر يضاهي أداؤه Gemini 3 Pro، ويتصدر قائمة أقوى النماذج المفتوحة المصدر على مستوى العالم.

وفقًا للمعلومات، حقق Qwen3.5 ثورة شاملة في بنية النموذج الأساسية، حيث يبلغ إجمالي المعلمات في إصدار Qwen3.5-Plus 397 مليار، مع تفعيل فقط 17 مليار، مما يمنحه تفوقًا على النماذج ذات المليارات من المعلمات، ويتفوق على نموذج Qwen3-Max الذي يضم تريليونات من المعلمات، مع تقليل استهلاك الذاكرة المخصصة للنشر بنسبة 60%، وزيادة كفاءة الاستنتاج بشكل كبير، حيث يمكن أن يصل أقصى معدل استنتاج إلى 19 ضعفًا. سعر واجهة برمجة التطبيقات (API) لـ Qwen3.5-Plus منخفض جدًا، حيث يبلغ 0.8 يوان لكل مليون رمز، وهو فقط 1/18 من سعر Gemini 3 Pro.

على عكس الأجيال السابقة من نماذج اللغة الكبيرة، حقق Qwen3.5 قفزة نوعية من نموذج يعتمد على النصوص فقط إلى نموذج متعدد الوسائط أصلي. حيث تم تدريب Qwen3 على رموز النصوص الصافية، بينما تم تدريب Qwen3.5 على رموز مختلطة من الصور والنصوص، مع إضافة كمية كبيرة من البيانات باللغتين الصينية والإنجليزية، واللغات المتعددة، وبيانات STEM، وبيانات الاستنتاج، مما مكن النموذج من تعلم معرفة العالم بشكل أكثر كثافة ومنطق استنتاج أكثر دقة، مع تحقيق أداء يفوق نماذج Qwen3-Max ذات المليارات من المعلمات بأقل من 40% من حجم المعلمات، في جميع الاختبارات الأساسية مثل الاستنتاج، البرمجة، ووكلاء الذكاء الاصطناعي. على سبيل المثال، حقق Qwen3.5 في اختبار المعرفة والاستنتاج MMLU-Pro درجة 87.8، متفوقًا على GPT-5.2؛ وفي اختبار الأسئلة الصعبة على مستوى الدكتوراه GPQA حصل على 88.4، متفوقًا على Claude 4.5؛ وفي اختبار الالتزام بالتعليمات IFBench سجل 76.5، محطماً جميع الأرقام القياسية للنماذج الأخرى؛ وفي اختبارات الوكيل العام BFCL-V4، ووكلاء البحث Browsecomp، تفوق Qwen3.5 على Gemini 3 Pro وGPT-5.2.

كما أدى التدريب متعدد الوسائط الأصلي إلى قفزة نوعية في قدرات الرؤية لدى Qwen3.5: حيث حقق أداءً ممتازًا في العديد من الاختبارات المعتمدة مثل الاستنتاج متعدد الوسائط (MathVison)، والأسئلة العامة بالصور (RealWorldQA)، والتعرف على النصوص وفهم الملفات (CC_OCR)، والذكاء المكاني (RefCOCO-avg)، وفهم الفيديو (MLVU)، حيث حصل على أفضل أداء في جميعها. وفي مهام حل المسائل العلمية، وتخطيط المهام، والاستنتاج في الفضاء الفيزيائي، تفوق Qwen3.5 على نموذج Qwen3-VL الخاص، مع تعزيز قدرات تحديد المواقع في الفضاء والاستنتاج باستخدام الصور بشكل كبير، مع تحليل استنتاجي أكثر دقة وتفصيلًا. وفي مجال فهم الفيديو، يدعم Qwen3.5 إدخال فيديوهات طويلة تصل إلى ساعتين (محتوى من 1 مليون رمز)، مما يجعله مناسبًا لتحليل المحتوى الطويل وتوليد الملخصات. بالإضافة إلى ذلك، حقق Qwen3.5 دمجًا أصليًا بين فهم الصور والقدرة على البرمجة، مع أدوات البحث بالصور وإنشاء الصور، حيث يمكنه تحويل رسومات الواجهات اليدوية مباشرة إلى رموز أمامية قابلة للاستخدام، ويمكنه تحديد وإصلاح مشكلات واجهة المستخدم من خلال لقطة شاشة واحدة، مما يجعل البرمجة البصرية أداة إنتاجية حقيقية.

تم إنجاز تدريب Qwen3.5 متعدد الوسائط الأصلي بكفاءة عالية على بنية تحتية للذكاء الاصطناعي من علي بابا سحابة. من خلال سلسلة من الابتكارات التقنية الأساسية، اقترب معدل معالجة البيانات في تدريب Qwen3.5 على البيانات المختلطة من 100% مقارنة بنماذج النصوص الصافية، مما يقلل بشكل كبير من عتبة صعوبة التدريب على البيانات متعددة الوسائط الأصلية؛ بالإضافة إلى ذلك، باستخدام استراتيجيات دقيقة لتطبيق دقة FP8 وFP32، عند توسيع التدريب ليشمل مئات التريليونات من الرموز، انخفض استهلاك الذاكرة النشطة بنسبة حوالي 50%، وزادت سرعة التدريب بنسبة 10%، مما يوفر تكاليف تدريب النموذج ويزيد من كفاءته.

كما حقق Qwen3.5 تقدمًا جديدًا من إطار عمل الوكيل (Agent) إلى تطبيقات الوكيل. حيث يمكن لـ Qwen3.5 التحكم بشكل مستقل في الهواتف الذكية وأجهزة الكمبيوتر، وأداء المهام اليومية بكفاءة، ودعم المزيد من التطبيقات والأوامر على الأجهزة المحمولة، ومعالجة عمليات أكثر تعقيدًا على الحواسيب، مثل تنظيم البيانات عبر التطبيقات، وتنفيذ العمليات الآلية، مما يعزز بشكل كبير من كفاءة التشغيل. كما أن فريق Qwen أنشأ إطار عمل للتعلم المعزز غير المتزامن للوكيل، يمكنه تسريع العمليات من 3 إلى 5 مرات، ويدعم توسيع الوكيل الذكي القابل للإضافة ليصل إلى ملايين الوكلاء.

وفقًا للمعلومات، تم دمج تطبيق Qwen ونسخة الحاسوب الشخصي (PC) مع نموذج Qwen3.5-Plus على الفور. يمكن للمطورين تنزيل النموذج الجديد من مجتمع 魔搭 وHuggingFace، أو الحصول على خدمات API مباشرة عبر علي بابا سحابة. وستواصل علي بابا فتح مصادر نماذج Qwen3.5 بأحجام ووظائف مختلفة، وسيتم إصدار النموذج الرائد Qwen3.5-Max الذي يتمتع بأداء أقوى قريبًا.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت