باحثو مايكروسوفت يتفوقون على معيار Perplexity الخاص بهم: تقييم النموذج المزدوج يدخل في الطليعة، وCowork يفتح بشكل متزامن وكيل المهام الطويلة

robot
إنشاء الملخص قيد التقدم

موقع CoinWorld: وفقًا لمراقبة 1M AI News، قامت مايكروسوفت بإتاحة قدرات جديدة إضافية لاثنتين من قدرات Microsoft 365 Copilot عبر Frontier (برنامج دخول مبكر للمستخدمين من المؤسسات لتجربة الميزات غير المتاحة رسميًا بعد، حيث يمكن للمشاركين تجربتها مسبقًا) بالتزامن. وقد أضاف Researcher (وكيل بحث عميق مدمج داخل Copilot) نمطي تعاون بين عدة نماذج: Critique وCouncil. يتم تنفيذ Critique عبر تعاون نماذج من Anthropic وOpenAI: يقوم أحدهما بالتخطيط والبحث وصياغة المسودة، بينما يتولى الآخر على وجه التحديد مراجعة وتحسين النص بدقة؛ وعند اختيار Auto يتم تفعيل ذلك افتراضيًا. وتعمل Council أيضًا بشكل متوازٍ باستخدام نموذجين من كلتا الشركتين؛ حيث يقوم كل نموذج بإنتاج تقرير كامل، ثم يقوم نموذج تقييم منفصل بتجميع أوجه التشابه والاختلاف. تستخدم مايكروسوفت GPT-5.2 كنموذج للحكم (وهو الأكثر صرامة ضمن طرق التقييم الثلاث المذكورة في الورقة الأصلية). ويتم اختبار Critique على معيار DRACO (وهو 100 سؤال بحثي معقد نشره باحثو Perplexity، ويغطي 10 مجالات). وقد حقق متوسط الدرجة الإجمالية تفوقًا قدره 7.0 نقاط على أفضل نظام في المعيار وهو Perplexity Deep Research (باستخدام Claude Opus 4.6)، ما يمثل تحسنًا نسبيًا بنسبة 13.88%. لم تُدرج الورقة الأصلية لـ DRACO Critique، وهذه بيانات اختبرتها مايكروسوفت بنفس بروتوكول التقييم بنفسها. أما Copilot Cowork فهو موجّه لعمل متعدد الخطوات يستمر لفترة أطول: يبدأ بتوليد خطة وفقًا للهدف، ثم ينتقل تدريجيًا عبر الأدوات والملفات، مع عرض التقدم خلال العملية، ويمكن للمستخدم التدخل في أي وقت. وقد استخدمت مايكروسوفت Capital Group كحالة تجربة مبكرة، حيث ذكرت أنه تم استخدامه في التخطيط للمشاريع، وتحديد الجداول الزمنية، وإعداد المواد للتسليم، والتحضير لعرض ومراجعة الإدارة العليا.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.26Kعدد الحائزين:0
    0.00%
  • القيمة السوقية:$2.26Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.41Kعدد الحائزين:2
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:0
    0.00%
  • تثبيت