ديب مايند تطلق مساعد البحث في الرياضيات بالذكاء الاصطناعي: بنية متعددة الوكلاء تتفوق على GPT-5.5Pro، وتحل مشكلة كانت سابقًا «لا يمكن للبشر حلها»

وفقًا لمراقبة Beating، أطلقت شركة جوجل DeepMind ذكاء اصطناعي يسمى co-mathematician، وهو منصة تفاعلية متعددة الوكلاء للباحثين في الرياضيات. حقق هذا النظام معدل دقة قدره 47.9٪ على معيار البحث العلمي الأكثر صعوبة حاليًا، FrontierMath Tier 4 (حل 23 من 48 مسألة)، متجاوزًا الرقم القياسي السابق GPT-5.5 Pro الذي كان 39.6٪. لم يستخدم هذا النظام الجيل الجديد من الأساس، بل استعمل مباشرة Gemini 3.1 Pro. هذا النموذج عند تشغيله بشكل مستقل على Tier 4 حقق فقط 19٪، لكن مع إضافة إطار الوكيل، تضاعفت النتائج تقريبًا. زودت DeepMind النظام بهيكلية متعددة الطبقات: في الأعلى، يوجد «منسق المشروع» الذي يقسم مهمة البحث إلى عدة تدفقات عمل، ويقوم بتوزيعها على وكلاء فرعيين متخصصين في استرجاع المعلومات، وكتابة الشفرات، والاستنتاج. كما يجب أن تمر الأدلة التي يكتبها الوكيل عبر جولة تقييم من قبل «وكلاء مراجعة» متعددين، ويجب الموافقة عليها قبل تقديمها. أثبتت هذه البنية المعقدة أن القدرة التي يمكن استغلالها من خلال التنسيق في الاستنتاج الرياضي المتقدم قد تتفوق على تحسينات النموذج نفسه. تم إجراء الاختبار السري بواسطة Epoch AI، ولمنع الغش، لم يكن فريق DeepMind يطلع على الأسئلة طوال الوقت، مع السماح لكل مسألة بالعمل لمدة 48 ساعة. ونتيجة لذلك، لم يكتفِ النظام بالوصول إلى القمة، بل حل أيضًا ثلاث مسائل فشلت فيها جميع النماذج السابقة. على الرغم من تسميته مساعدًا، إلا أنه أشبه بزميل يمتلك قدرة على التفكير الإبداعي. استخدمه خبير الجبر الجماعي مارك لاكنبي في حل فرضية علنية في ملاحظات Kourovka خلال أبحاثه العملية. ومن المثير للاهتمام أن الاستراتيجية التي اقترحها النظام في البداية وُصفت بأنها «معيبة» من قبل وكيل المراجعة الخاص به، لكن لاكنبي لاحظ أن هناك فكرة ذكية مخبأة في الحلول غير الصحيحة، فقام بإضافة الفجوة بنفسه وأتمّ الإثبات. حاليًا، يقتصر الوصول إلى AI co-mathematician على عدد محدود من العلماء في المرحلة التجريبية.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت