كود خالص يتحدى الشبكات العصبية! النماذج الكبيرة تكتب قواعد التحكم يدويًا وتدخل في الصناعة الصلبة، استراتيجيات كاملة بتكلفة 14 دولارًا فقط

robot
إنشاء الملخص قيد التقدم
AIMPACT رسالة، 19 مايو (UTC+8)، وفقًا لمراقبة 动察 Beating، أثبت عضو فريق ما بعد التدريب في OpenAI ونجيا يي أن "الاعتماد فقط على النماذج الكبيرة لكتابة الشفرات يمكن أن ينجح في اجتياز ألعاب أتاري"، حيث قام الباحث بول غارنييه بنقل هذه الطريقة إلى التحكم في ميكانيكا السوائل الأكثر صعوبة. لم يُدرّب شبكة عصبية على الإطلاق طوال العملية. فقط جعل Codex 5.5 يعمل كمبرمج، يراقب تسجيلات محاكاة السوائل ويعيد كتابة سكربتات بايثون مرارًا وتكرارًا. فقط باستخدام قواعد التحكم اليدوية هذه، تمكن الذكاء الاصطناعي من التفوق على خط الأساس للتعلم المعزز العميق (DRL) في أكثر من نصف السيناريوهات، بعد أن اجتاز أكثر من عشرة اختبارات في الفيزياء. لمساعدة السيارات على تقليل المقاومة وتهدئة اضطرابات الأنابيب، كانت الصناعة سابقًا تعتمد على زيادة القدرة الحاسوبية بشكل كبير، وتغذية نموذج غامض غير مفهوم للتحكم في صمامات تدفق الهواء. تجاوز Codex هذا الطريق المسدود. القواعد التي يكتبها بسيطة جدًا، مثل "عندما يكون الانحناء المحلي كبيرًا جدًا، يتم تأخير النفث". بضع عشرات من الأسطر من الشفرة التي تحتوي على معرفة في الفيزياء، حلت محل التجربة والخطأ العشوائية التي تعتمد على الشبكات العصبية. استبدال الصندوق الأسود بالكود، قضى على مشكلة الجمود في الشبكات العصبية التي تتكسر عند أقل اصطدام. سابقًا، إذا حدث تعديل بسيط في الأجهزة (مثل تغيير عدد الفتحات من 5 إلى 10)، كانت النماذج القديمة تُلغى على الفور ويجب إعادة تدريبها بتكلفة مالية. الآن، فقط بتغيير ثابت في الكود، يمكن للنظام التكيف مع الأجهزة الجديدة على الفور. عندما تم تمديد زمن الاختبار بأربعة أضعاف، انهارت نماذج DRL التقليدية التي تعتمد على الخبرة؛ لكن الكود الذي يكتبه النموذج الكبير، لأنه يتبع المنطق الفيزيائي مباشرة، يظل مستقرًا دائمًا. لتحقيق هذه الاستراتيجية الكاملة للتحكم، استهلك النموذج الكبير 21.25 مليون توكن، وتكلفته أقل من 14 دولارًا. (المصدر: BlockBeats)
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت