العقود الآجلة
وصول إلى مئات العقود الدائمة
TradFi
الذهب
منصّة واحدة للأصول التقليدية العالمية
الخیارات المتاحة
Hot
تداول خيارات الفانيلا على الطريقة الأوروبية
الحساب الموحد
زيادة كفاءة رأس المال إلى أقصى حد
التداول التجريبي
مقدمة حول تداول العقود الآجلة
استعد لتداول العقود الآجلة
أحداث مستقبلية
"انضم إلى الفعاليات لكسب المكافآت "
التداول التجريبي
استخدم الأموال الافتراضية لتجربة التداول بدون مخاطر
إطلاق
CandyDrop
اجمع الحلوى لتحصل على توزيعات مجانية.
منصة الإطلاق
-التخزين السريع، واربح رموزًا مميزة جديدة محتملة!
HODLer Airdrop
احتفظ بـ GT واحصل على توزيعات مجانية ضخمة مجانًا
منصة الإطلاق
كن من الأوائل في الانضمام إلى مشروع التوكن الكبير القادم
نقاط Alpha
تداول الأصول على السلسلة واكسب التوزيعات المجانية
نقاط العقود الآجلة
اكسب نقاط العقود الآجلة وطالب بمكافآت التوزيع المجاني
رأي مولليك: ARC-AGI-3 ليس نسخة مطورة، إنه شيء مختلف تمامًا
كيف يقول مولك
وجهة نظر إيثان مولك (من كلية وارتون) واضحة: لا تقارن ARC-AGI-3 بالجيلين السابقين. يقول إن هذا “اختبار مختلف تمامًا”، القواعد قد تغيرت، وما يتم تقييمه أيضًا قد تغير. يمكنك اعتباره معيارًا جديدًا مفيدًا، لكن لا تتوقع أن يتم مقارنته بالأعمال السابقة.
ما الذي يختلف بالضبط
كانت ARC-AGI-1 و2 في الأساس ألغاز شبكية ثابتة، تعطيك مدخلات ومخرجات، وتجاب مرة واحدة. ARC-AGI-3 تلقي بالنموذج في بيئة تفاعلية، وتطلب منه في مشاهد غير مألوفة:
طريقة التقييم أيضًا تغيرت: التركيز الأساسي هو على مدى كفاءتك في إكمال نفس المهمة مقارنة بالبشر.
حدد فرانسوا شولت الهدف من ARC-AGI-3 بأنه “كفاءة اكتساب المهارات”: هل يمكن للنموذج تعلم مهام جديدة بسرعة بناءً على الاستدلال الأساسي، بدلاً من تطبيق الأنماط على البيانات التي تم رؤيتها من قبل.
مقارنة الأجيال الثلاثة
لماذا النتائج مختلفة بهذا القدر
تم تصميم هذا المعيار عمدًا بحيث لا يمكن الاعتماد على تراكم البيانات أو الحسابات العنيفة لتحقيق النقاط. لقد أصاب مباشرة نقطة ضعف النماذج الحالية: القدرة على التعميم والقدرة على التعلم السريع ليست جيدة.
ماذا يعني ذلك للتقييم والبحث
المعايير الثابتة يسهل “ترويضها” — يمكن للنموذج الذي شهد بيانات تدريب مشابهة تحقيق درجات عالية، لكن القدرات قد لا تكون قد تحسنت حقًا. ARC-AGI-3 تحاول قياس أشياء أقرب إلى الاستقلالية الحقيقية:
تم تحديد آليات التحفيز والجدول الزمني المصاحب أيضًا:
تأثير ذلك على الباحثين والمطورين
الحكم: إذا كنت تعمل على ذكاء اصطناعي يتمتع بقدرة حقيقية على الاستقلالية، فلا يزال الطريق طويلًا، لكن الاتجاه يتضح بشكل متزايد. الفرق التي تقوم بالبحث والتطوير على المدى الطويل وصناديق البحث هي الأكثر صلة؛ أما بالنسبة للعمليات قصيرة المدى، فمن الأفضل الانتظار حتى تظهر اختراقات يمكن التحقق منها ونقاط تجارية قبل اتخاذ القرارات.