باحث في مايكروسوفت يتفوق في معيار بيربلكسيتي الذي طورته بنفسه: مراجعة نموذج مزدوج في فرونتير، وكوورك يطلق وكيل المهام الطويلة

robot
إنشاء الملخص قيد التقدم

وفقًا لمتابعة 1M AI News، قامت مايكروسوفت بإطلاق ميزتين جديدتين في وقت واحد لـ Microsoft 365 Copilot عبر Frontier (وهو برنامج تجريبي ما قبل الإطلاق للمستخدمين المؤسسيين يتيح للمشاركين تجربة ميزات Copilot قبل إطلاقها رسميًا). أضاف الباحث (وهو وكيل البحث العميق المدمج في Copilot) وضعَي تعاون جديدين متعددَي النماذج: Critique وCouncil. يعمل Critique بالتعاون مع نماذج من Anthropic وOpenAI: أحدهما مسؤول عن التخطيط والاسترجاع وصياغة المسودات، بينما يتخصص الآخر في المراجعة والتحسين، مع تفعيل Auto بشكل افتراضي. يعمل Council بطريقة مماثلة مع كِلا النموذجين اللذين يولدان تقارير كاملة، ثم يتم تلخيصها بواسطة نموذج مراجعة منفصل. تستخدم مايكروسوفت GPT-5.2 كنموذج للتقييم (وهو الأكثر صرامة ضمن طرق التقييم الثلاث في الورقة الأصلية) لاختبار Critique على معيار DRACO (الذي يتضمن 100 سؤال بحثي معقّد عبر 10 مجالات منشورة من قبل باحثي Perplexity). كانت النتيجة الإجمالية أعلى بسبع نقاط.0 مقارنةً بأفضل نظام في المعيار، وهو Perplexity Deep Research (الذي يستخدم Claude Opus 4.6)، ما يمثل تحسّنًا نسبيًا بنسبة 13.88%. لم يُدرج Critique في الورقة الأصلية الخاصة بـ DRACO، وقد حصلت مايكروسوفت على هذه البيانات عبر الاختبار الذاتي ضمن بروتوكول التقييم نفسه. يهدف Copilot Cowork إلى المهام الأطول متعددة الخطوات: فهو يُنشئ أولاً خطة بناءً على الأهداف، ثم ينتقل خطوة بخطوة عبر الأدوات والمستندات، مع عرض التقدم طوال العملية، ما يتيح للمستخدمين التدخل في أي وقت. وقد استشهدت مايكروسوفت بـ Capital Group باعتباره حالة استخدام مبكرة، قائلة إنه تم استخدامه في تخطيط المشاريع، وتحديد الجدول الزمني، وإنشاء المخرجات، وإعداد المراجعات التنفيذية.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$0.1عدد الحائزين:0
    0.00%
  • القيمة السوقية:$2.28Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.43Kعدد الحائزين:2
    1.03%
  • القيمة السوقية:$2.27Kعدد الحائزين:2
    0.00%
  • القيمة السوقية:$2.33Kعدد الحائزين:2
    0.00%
  • تثبيت