تقرير أنثروبيك يرد على التطور الذاتي: تم تشغيل الحلقة المغلقة الجزئية، لكن لا تزال هناك مسافة نحو التدريب الذاتي الكامل

robot
إنشاء الملخص قيد التقدم
وفقًا لمراقبة Beating، فإن قدرة الذكاء الاصطناعي على التكرار الذاتي تتجاوز توقعات الجميع. أصدر معهد أنثروبيك (The Anthropic Institute) في 5 يونيو تقريرًا بعنوان «عندما يبني الذكاء الاصطناعي نفسه»، يكشف بالتفصيل عن تقدم أبحاثه في مجال «التحسين الذاتي التكراري». تشير البيانات إلى أنه بحلول مايو 2026، أكثر من 80٪ من الشفرة المدمجة في قاعدة الكود الرئيسية لأنثروبيك كانت من كتابة Claude نفسه. قبل إصدار Claude Code في فبراير 2025، كانت نسبة الشفرات التي كتبها Claude في الأرقام الأحادية. توقع مؤسس شركة Zhipu AI، تانغ جيه، في 13 مايو أن النهاية المحتملة للنماذج الكبيرة هي التطور الذاتي، وأن Claude ربما قد تجاوز بالفعل خط الأساس للتدريب الذاتي «كتابة الشفرة، تنظيف البيانات، تدريب نفسه بنفسه». لكن أنثروبيك أوضح في التقرير أن تحقيق تحسين تكراري مستقل بالكامل وتصميم وتطوير الخلفاء بشكل ذاتي لم يتحقق بعد. يلعب الذكاء الاصطناعي دورًا متزايدًا في سلسلة التطوير، حيث ينتقل من تحسين جزئي إلى اتخاذ قرارات مستقلة. في الربع الثاني من 2026، بلغ متوسط الكود المدمج يوميًا من قبل مهندسي أنثروبيك 8 أضعاف ما كان عليه في 2024. العملية الحالية للتطوير بسيطة: المهندسون يخططون للأهداف ويقومون بالمراجعة، بينما يتولى Claude كتابة الكود وتنفيذه. كما قامت أنثروبيك بنشر Claude ليكون مراجعًا تلقائيًا للكود، مسؤولًا عن اعتراض الأخطاء والثغرات الأمنية. هذا يدل على أن الركيزة «الحكم الذاتي» التي أشار إليها تانغ جيه قد تم تطبيقها في الجانب الهندسي، لكن المراجعة البشرية لا تزال الحاجز النهائي للأمان. كما أن موثوقية تنفيذ النماذج لمهام طويلة الأمد تتضاعف أيضًا. يمكن للنموذج أن يعمل بشكل مستقل لمدة تتراوح عادة كل 4 أشهر. في مارس 2024، كان Claude 3 Opus قادرًا على معالجة مهام بسيطة لمدة 4 دقائق فقط. بعد عام، أصبح Claude 3.7 Sonnet قادرًا على الصمود لمدة 1.5 ساعة. بحلول مارس 2026، أصبح Claude 4.6 Opus قادرًا على التعامل مع مهام معقدة لمدة 12 ساعة. وفقًا لبيانات مؤسسة التقييم METR، فإن أحدث إصدار من Claude Mythos Preview يمكنه العمل بشكل مستقل لأكثر من 16 ساعة، مما يقترب من الحد الأقصى لأدوات التقييم الحالية. بسرعة النمو الحالية، بحلول عام 2027، سيكون الذكاء الاصطناعي قادرًا على إنجاز المهام البحثية التي تتطلب أسابيع من العمل البشري بشكل مستقل، مما يساعد الشركات على الانتقال من «شركة فردية» إلى «شركة بدون موظفين». أما بالنسبة لتخمين تانغ جيه حول «خط الأساس للتدريب الذاتي»، فإن التقرير يكشف في الواقع عن «حلقة تجريبية مصغرة» جزئية. في تجربة تسريع تدريب النماذج الصغيرة، في مايو 2025، كان Claude 4 Opus قادرًا على زيادة سرعة الكود بمقدار 3 أضعاف فقط، بينما في أبريل 2026، حقق إصدار Claude Mythos Preview تسريعًا بمقدار 52 ضعفًا. بالمقارنة، عادةً ما يستطيع أفضل الباحثين البشريين تحقيق زيادة بمقدار 4 أضعاف خلال 4 إلى 8 ساعات. ومع ذلك، فإن أهداف التحسين ومعايير النجاح في التجارب كانت محددة مسبقًا من قبل البشر. عند مواجهة سلسلة كاملة من «تنظيف البيانات، توليد بيانات تركيبية، والتدريب الذاتي» المعقدة، لا تزال قدرة اتخاذ القرار لدى الذكاء الاصطناعي غير مكتملة. ومع ذلك، فإن الحلقة المغلقة المستقلة في سلسلة البحث والتطوير تدفع البشر نحو حافة فقدان السيطرة النهائية على النظام. يتوقع تانغ جيه أن «نظام تشغيل LLM يستبدل البنية التقليدية، والتطبيقات تُولد حسب الطلب بشكل فوري»، مما يعني أن جميع عمليات الحوسبة المستقبلية ستكون عبارة عن رموز ديناميكية لا يمكن مراجعتها مسبقًا؛ وتحذر أنثروبيك من أن «المراجعة البشرية لن تواكب تطور الذكاء الاصطناعي الذاتي»، مما يعني أننا لن نتمكن حتى من مراقبة مصدر الشفرة المولدة. عندما يبدأ الذكاء الاصطناعي في تصميم وتدريب الخلفاء بشكل مستقل، فإن تطور البرمجيات سيصبح تمامًا صندوقًا أسود. إذا تُرك الذكاء الاصطناعي يجري تكرارات ذاتية دون مراجعة بشرية في نظام الصندوق الأسود، فإن ضمانات الأمان، والمراقبة، ومحاذاة السلوك لنظام تحسين الذات ستصبح مهمة جدًا.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت