شركة مايكروسوفت جعلت GPT وClaude يعملان معًا—والنتيجة تتفوق على كل أداة بحث عن الذكاء الاصطناعي موجودة

باختصار

  • أصدرت مايكروسوفت وضعين مختلفين يزاوجان بين GPT وClaude لرفع جودة أبحاث الذكاء الاصطناعي.
  • يتيح النقد (Critique) للنماذج التعاون، بينما يجعل المجلس (Council) النماذج تعمل بالتوازي مع حكمٍ ثالث يحدد التفاوتات.
  • تصلح سير عمل النموذجين هذه الهلوسة، وضعف الاستشهادات، وغيرها من المشكلات المرتبطة بأبحاث الذكاء الاصطناعي التي تعتمد على نموذج واحد.

لقد كان ذكاء اصطناعي “البحث العميق” من أكثر سباقات الأسلحة سخونة في مجال التكنولوجيا هذا العام. أعلنت Google عن وكيلها البحثي الخاص بـGemini في ديسمبر 2024، وأصدرت OpenAI وكيلها البحثي الخاص بها في فبراير 2025، وتبعتها xAI، وتضاعفت Perplexity في هذا الاتجاه، وبنى Claude التابع لـAnthropic قاعدة مخلصة بين المحترفين الذين يحتاجون إلى إجابات مفصلة مع توثيق، مقدّمًا وكيله في أبريل من العام الماضي.

كانت كل شركة تحاول إقناعك بأن نموذجها الذكاء الاصطناعي الواحد هو “أذكى باحث” في الغرفة. قالت مايكروسوفت للتو: لماذا تختار واحدًا؟

أعلنت الشركة يوم الاثنين عن ميزتين جديدتين لأداة Copilot’s Researcher—المسميتين Critique وCouncil—وتضعان GPT الخاص بـOpenAI وClaude الخاص بـAnthropic للعمل على نفس مهمة البحث بالتسلسل. والنتيجة، وفقًا لاختبارات مايكروسوفت مقارنةً بمعيار صناعي، تسجل أعلى من كل الأنظمة المدرجة في ذلك الاختبار، بما في ذلك النماذج من كبريات شركات الذكاء الاصطناعي.

تقديم Critique، نظام بحث عميق متعدد النماذج جديد داخل M365 Copilot.

يمكنك استخدام عدة نماذج معًا لتوليد استجابات وتقارير مثالية. pic.twitter.com/m4RlQmCKzs

— ساتيا ناديلا (@satyanadella) 30 مارس 2026

“Critique هو نظام بحث عميق متعدد النماذج جديد مُصمم لمهام بحثية معقدة. يفصل بين التوليد والتقييم ويستخدم مجموعة من النماذج من فرق Frontier، بما في ذلك Anthropic وOpenAI”، تشرح مايكروسوفت. “يقود نموذج واحد مرحلة التوليد—وتخطيط المهمة—والتكرار عبر الاسترجاع، وإنتاج مسودة أولية، بينما يركز نموذج ثانٍ على المراجعة والتحسين، ويعمل كمراجع خبير قبل أن يُنتَج التقرير النهائي.”

إليك المشكلة الأساسية التي صُمم Critique لإصلاحها: تعمل اليوم كل أدوات بحث الذكاء الاصطناعي بالطريقة نفسها. تطرح سؤالًا، يقوم نموذج واحد بتخطيط بحث، ويقلب المصادر، ويكتب تقريرًا، ثم يعيده إليك. هذا النموذج الواحد يقوم بكل شيء دون أن يقوم أحد بالتحقق من عمله.

قد يؤدي ذلك إلى تسلل بعض الهلوسة، ووقوع بعض الأخطاء في الاستشهادات، وتقديم ادعاءات مزيفة أو غير دقيقة، إلخ.



يكسر Critique سير العمل هذا إلى جزأين. يتولى GPT المرحلة الأولى—يخطط للبحث، ويستخرج المصادر، ويكتب مسودة أولية. ثم يتدخل Claude كمدقق صارم، ويراجع التقرير من حيث الدقة الواقعية وجودة الاستشهادات وما إذا كانت الإجابة قد عالجت فعليًا ما طُلب. ولا يصل التقرير النهائي إلى المستخدم إلا بعد هذه المراجعة. تقول مايكروسوفت إن الأدوار يمكن أن تعمل أيضًا في الاتجاه المعاكس في النهاية—مع قيام Claude بصياغة المسودة وGPT بإجراء النقد—لكن GPT يتقدم أولًا حاليًا.

في معيار DRACO—اختبار مُوحّد يغطي 100 مهمة بحث معقدة عبر 10 مجالات تشمل الطب والقانون والتكنولوجيا—سجل Copilot مع Critique 57.4 نقطة. وسجل Claude Opus الخاص بـAnthropic وحده 42.7 نقطة فقط. يتفوق النظام المُدمج من مايكروسوفت على أفضل نتيجة تالية بنسبة تقارب 14%.

صورة: مايكروسوفت

أكبر المكاسب ظهرت في اتساع نطاق التحليل وجودة العرض، مع تسجيل تحسنٍ كبير أيضًا في الدقة الواقعية.

تتبع الميزة الثانية، Council، نهجًا مختلفًا تجاه المشكلة نفسها. بدلًا من أن يقوم نموذج واحد بمراجعة عمل الآخر، يقوم Council بتشغيل GPT وClaude في الوقت نفسه ويضع تقاريرهما الكاملة جنبًا إلى جنب. ثم يقوم نموذج “حكم” ثالث بقراءة الاثنين وكتابة ملخص يوضح أين اتفق الذكاءان، وأين اختلفا، وما الزوايا الفريدة التي التقطها كل واحد ولم يلتقطها الآخر. مقارنة أدوات بحث الذكاء الاصطناعي يدويًا كانت شيئًا كان على المستخدمين فعله بأنفسهم حتى الآن.

في Critique، تتعاون النماذج فعليًا مع بعضها البعض، بينما في Council تتنافس النماذج ضد بعضها البعض.

يعد Critique التجربة الافتراضية في Researcher، بينما يتطلب Council منك تحديد “Model Council” من القائمة لتفعيل وضع العرض جنبًا إلى جنب. تتوفر كلتا الميزتين حاليًا للمستخدمين المسجلين في برنامج Frontier لدى مايكروسوفت، وهو قناة الوصول المبكر لأحدث قدرات Copilot. يلزم الحصول على ترخيص مايكروسوفت 365 Copilot ($30/للمستخدم/شهريًا)، لكن يلزم أيضًا أن يكون المستخدمون مسجلين في Frontier للوصول إليهما.

صورة: مايكروسوفت

توجد لدى OpenAI ومايكروسوفت شراكة متعددة المليارات من الدولارات، لكن رهان مايكروسوفت هو أن أي نموذج واحد لن يبقى في الصدارة لفترة طويلة، وأن القيمة الحقيقية تكمن في طبقة التنسيق التي توجه المهام إلى أي مجموعة من النماذج تعمل بأفضل نتيجة.

نشرة Daily Debrief

ابدأ كل يوم بأبرز أخبار الساعة، بالإضافة إلى ميزات أصلية وبودكاست وفيديوهات وأكثر من ذلك.

بريدك الإلكتروني

احصل عليها!

احصل عليها!

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.22Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.22Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.31Kعدد الحائزين:2
    0.44%
  • القيمة السوقية:$2.3Kعدد الحائزين:2
    0.44%
  • القيمة السوقية:$2.69Kعدد الحائزين:2
    3.53%
  • تثبيت