العقود الآجلة
وصول إلى مئات العقود الدائمة
TradFi
الذهب
منصّة واحدة للأصول التقليدية العالمية
الخیارات المتاحة
Hot
تداول خيارات الفانيلا على الطريقة الأوروبية
الحساب الموحد
زيادة كفاءة رأس المال إلى أقصى حد
التداول التجريبي
مقدمة حول تداول العقود الآجلة
استعد لتداول العقود الآجلة
أحداث مستقبلية
"انضم إلى الفعاليات لكسب المكافآت "
التداول التجريبي
استخدم الأموال الافتراضية لتجربة التداول بدون مخاطر
إطلاق
CandyDrop
اجمع الحلوى لتحصل على توزيعات مجانية.
منصة الإطلاق
-التخزين السريع، واربح رموزًا مميزة جديدة محتملة!
HODLer Airdrop
احتفظ بـ GT واحصل على توزيعات مجانية ضخمة مجانًا
منصة الإطلاق
كن من الأوائل في الانضمام إلى مشروع التوكن الكبير القادم
نقاط Alpha
تداول الأصول على السلسلة واكسب التوزيعات المجانية
نقاط العقود الآجلة
اكسب نقاط العقود الآجلة وطالب بمكافآت التوزيع المجاني
أوبن إيه آي تطلق SWE-Lancer: معيار جديد للذكاء الاصطناعي لبرمجة العمل الحر في العالم الحقيقي
اكتشف أبرز أخبار وأحداث التكنولوجيا المالية!
اشترك في النشرة الإخبارية لـ FinTech Weekly
يقرأها المديرون التنفيذيون في JP Morgan وCoinbase وBlackrock وKlarna وغيرها
معيار جديد لقياس مهارات الذكاء الاصطناعي في البرمجة ضمن اقتصاد الوظائف المؤقتة
يتقدم الذكاء الاصطناعي إلى عالم تطوير البرمجيات للعمل الحر عبر معيار جديد مُصمم لاختبار قدراته البرمجية مقابل مهام واقعية. ويُطلق عليه اسم SWE-Lancer، وقد طرحه OpenAI ويقيّم أداء الذكاء الاصطناعي باستخدام أكثر من 1,400 مهمة فعلية لتطوير برمجيات للعمل الحر من Upwork، تبلغ قيمتها مجتمعة 1 مليون دولار كمدفوعات.
تهدف هذه المبادرة إلى تقديم صورة أوضح عن قدرات الذكاء الاصطناعي في بيئة مهنية. وبدلًا من الاعتماد على مسائل برمجية اصطناعية، يستخدم SWE-Lancer مهامًا تم إنجازها والدفع مقابلها من قِبل شركات حقيقية، ما يوفّر قياسًا أكثر واقعية لفعالية الذكاء الاصطناعي في هندسة البرمجيات.
وظائف عمل حر حقيقية، تحديات حقيقية
تركّز أغلب معايير قياس برمجة الذكاء الاصطناعي على مشكلات محددة جيدًا مع حلول متوقعة. لكن SWE-Lancer يختلف عن ذلك. يتضمن مجموعة البيانات مجموعة واسعة من المهام، بدءًا من إصلاحات أخطاء بقيمة 50 دولارًا وصولًا إلى تنفيذ ميزات معقدة بقيمة 32,000 دولار. تختبر بعض التكليفات قدرة الذكاء الاصطناعي على كتابة الكود، بينما تتطلب تكليفات أخرى اتخاذ القرار—محاكاة دور مدير هندسي عبر اختيار الخيارات بين مقترحات تقنية متنافسة.
ولضمان الدقة، يتم التحقق من الاختبارات من البداية إلى النهاية ثلاث مرات بواسطة مهندسين ذوي خبرة، كما تُقيّم خيارات الإدارة استنادًا إلى قرارات مديري التوظيف الأصليين. لا يقيس المعيار فقط ما إذا كان بإمكان الذكاء الاصطناعي كتابة الكود—بل يقيّم أيضًا ما إذا كانت هذه التعليمات البرمجية تفي بالمعايير المتوقعة من العملاء الذين يدفعون.
كيف يتّرت أداء نماذج الذكاء الاصطناعي؟
النتائج واضحة: حتى أكثر نماذج الذكاء الاصطناعي تقدّمًا تواجه صعوبة في التعامل مع هذه المهام. ورغم أن الذكاء الاصطناعي أثبت قدرته على توليد مقتطفات كود والمساعدة في تصحيح الأخطاء، إلا أنه ما يزال متأخرًا عند التعامل مع التعقيد الكامل للعمل الهندسي في مجال العمل الحر. تظل المهام التي تتطلب الإبداع وحل المشكلات والتخطيط طويل الأجل تحديًا.
لهذه الفجوة آثار كبيرة. يتزايد دور الذكاء الاصطناعي في تطوير البرمجيات، لكن معايير مثل SWE-Lancer تشير إلى أن البرمجة المستقلة بالكامل ما زالت بعيدة. وحتى الآن، لا يزال المهندسون البشريون عنصرًا أساسيًا، خصوصًا للمشروعات المعقدة التي تتجاوز مجرد توليد كود بسيط.
إتاحة المصدر للاستخدام في البحث ورؤى اقتصادية
لتشجيع المزيد من الدراسة، أتاح فريق SWE-Lancer موارد رئيسية للعامة. يمكن للباحثين الوصول إلى صورة Docker موحّدة وإلى جزء من المعيار يُسمى SWE-Lancer Diamond للتقييم. ومن خلال ربط أداء الذكاء الاصطناعي بالقيمة النقدية الفعلية، يوفر هذا المعيار رؤى جديدة حول كيف يمكن أن يؤثر الذكاء الاصطناعي في الاقتصاد وسوق وظائف هندسة البرمجيات.
وبعيدًا عن تطوير البرمجيات، قد تكون هذه الرؤى قيمة لشركات التكنولوجيا المالية والجهات التي تعتمد على المواهب العاملة بنظام العمل الحر. ومع تحسّن نماذج الذكاء الاصطناعي، ستحتاج الشركات إلى طرق أفضل لقياس الأثر المالي والتشغيلي للأتمتة. يقدم SWE-Lancer أساسًا لفهم كيفية إمكانية دمج الذكاء الاصطناعي في الأعمال القائمة على العقود.
خطوة نحو مستقبل الذكاء الاصطناعي في تطوير البرمجيات
يُبرز إصدار SWE-Lancer حقيقة مهمة: يتقدم الذكاء الاصطناعي، لكنه ما يزال يعجز عن تلبية متطلبات العالم الواقعي لتطوير البرمجيات في مجال العمل الحر. رغم أن أدوات الذكاء الاصطناعي يمكن أن تساعد المطورين، إلا أنها ليست بعد بدائل موثوقة للمتخصصين المهرة.
ومع استمرار أبحاث الذكاء الاصطناعي، ستساعد معايير مثل SWE-Lancer في تتبّع التقدم، وتحسين النماذج، وتشكيل النقاشات حول الآثار الاقتصادية للأتمتة. يبقى ما إذا كان الذكاء الاصطناعي سيحل محل مطوري العمل الحر بالكامل أمرًا غير مؤكد، لكن في الوقت الحالي، تظل اللمسة البشرية في هندسة البرمجيات لا تُستبدل.