وفقًا لمراقبة Beating، أطلقت شركة جوجل ديب مايند نموذج الذكاء الاصطناعي المساعد في الرياضيات، وهو منصة تفاعلية متعددة الوكلاء للباحثين في الرياضيات. حقق هذا النظام معدل دقة 47.9٪ على معيار البحث العلمي الأصعب حاليًا، FrontierMath Tier 4 (حل 23 من 48 مسألة)، متجاوزًا الرقم القياسي السابق لـ GPT-5.5 Pro البالغ 39.6٪. لم يستخدم هذا النظام قاعدة أساسية من الجيل الجديد، بل استعمل مباشرة Gemini 3.1 Pro. هذا النموذج عند تشغيله بشكل مستقل على Tier 4 يحقق فقط 19٪، لكن مع إضافة إطار الوكيل، تضاعفت النتائج تقريبًا. قدمت ديب مايند بنية متعددة الطبقات له: في الأعلى، يوجد "منسق المشروع" الذي يقسم مهمة البحث إلى عدة تدفقات عمل، ويقوم بتوزيعها على الفرق.

MarsBitNews

2026-05-09 12:59:17

وفقًا لمراقبة Beating، أطلقت شركة جوجل DeepMind ذكاء اصطناعي يسمى co-mathematician، وهو منصة تفاعلية متعددة الوكلاء للباحثين في الرياضيات. حقق هذا النظام معدل دقة قدره 47.9٪ على معيار البحث العلمي الأكثر صعوبة حاليًا، FrontierMath Tier 4 (حل 23 من 48 مسألة)، متجاوزًا الرقم القياسي السابق GPT-5.5 Pro الذي كان 39.6٪. لم يستخدم هذا النظام الجيل الجديد من الأساس، بل استعمل مباشرة Gemini 3.1 Pro. هذا النموذج عند تشغيله بشكل مستقل على Tier 4 حقق فقط 19٪، لكن مع إضافة إطار الوكيل، تضاعفت النتائج تقريبًا. زودت DeepMind النظام بهيكلية متعددة الطبقات: في الأعلى، يوجد «منسق المشروع» الذي يقسم مهمة البحث إلى عدة تدفقات عمل، ويقوم بتوزيعها على وكلاء فرعيين متخصصين في استرجاع المعلومات، وكتابة الشفرات، والاستنتاج. كما يجب أن تمر الأدلة التي يكتبها الوكيل عبر جولة تقييم من قبل «وكلاء مراجعة» متعددين، ويجب الموافقة عليها قبل تقديمها. أثبتت هذه البنية المعقدة أن القدرة التي يمكن استغلالها من خلال التنسيق في الاستنتاج الرياضي المتقدم قد تتفوق على تحسينات النموذج نفسه. تم إجراء الاختبار السري بواسطة Epoch AI، ولمنع الغش، لم يكن فريق DeepMind يطلع على الأسئلة طوال الوقت، مع السماح لكل مسألة بالعمل لمدة 48 ساعة. ونتيجة لذلك، لم يكتفِ النظام بالوصول إلى القمة، بل حل أيضًا ثلاث مسائل فشلت فيها جميع النماذج السابقة. على الرغم من تسميته مساعدًا، إلا أنه أشبه بزميل يمتلك قدرة على التفكير الإبداعي. استخدمه خبير الجبر الجماعي مارك لاكنبي في حل فرضية علنية في ملاحظات Kourovka خلال أبحاثه العملية. ومن المثير للاهتمام أن الاستراتيجية التي اقترحها النظام في البداية وُصفت بأنها «معيبة» من قبل وكيل المراجعة الخاص به، لكن لاكنبي لاحظ أن هناك فكرة ذكية مخبأة في الحلول غير الصحيحة، فقام بإضافة الفجوة بنفسه وأتمّ الإثبات. حاليًا، يقتصر الوصول إلى AI co-mathematician على عدد محدود من العلماء في المرحلة التجريبية.

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

أعجبني
إعجاب
تعليق
إعادة النشر
مشاركة

تعليق

إضافة تعليق

لا توجد تعليقات

المواضيع الرائجة
عرض المزيد
#
GateSquareMayTradingShare
992.3K درجة الشعبية
#
BTCBackAbove80K
59.44M درجة الشعبية
#
IsraelStrikesIranBTCPlunges
45.56K درجة الشعبية
#
JapanTokenizesGovernmentBonds
1.9M درجة الشعبية
#
#DailyPolymarketHotspot
866.41K درجة الشعبية

تثبيت

خريطة الموقع

ديب مايند تطلق مساعد البحث في الرياضيات بالذكاء الاصطناعي: بنية متعددة الوكلاء تتفوق على GPT-5.5Pro، وتحل مشكلة كانت سابقًا «لا يمكن للبشر حلها»

المواضيع الرائجة

GateSquareMayTradingShare

BTCBackAbove80K

IsraelStrikesIranBTCPlunges

JapanTokenizesGovernmentBonds

#DailyPolymarketHotspot

تثبيت