العقود الآجلة
وصول إلى مئات العقود الدائمة
CFD
الذهب
منصّة واحدة للأصول التقليدية العالمية
الخیارات المتاحة
Hot
تداول خيارات الفانيلا على الطريقة الأوروبية
الحساب الموحد
زيادة كفاءة رأس المال إلى أقصى حد
التداول التجريبي
مقدمة حول تداول العقود الآجلة
استعد لتداول العقود الآجلة
أحداث مستقبلية
"انضم إلى الفعاليات لكسب المكافآت "
التداول التجريبي
استخدم الأموال الافتراضية لتجربة التداول بدون مخاطر
CFD
مشتقات CFD للأسهم الأمريكية
الأسهم الأمريكية
وصول إلى الأسهم الأمريكية وصناديق ETF الحقيقية
أسهم هونغ كونغ
تداول أسهم عالية الجودة مدرجة في هونغ كونغ
الأسهم الكورية
SK Hynix
تداول الأسهم الكورية الحقيقية واستثمر في الأصول الشائعة
العقود الآجلة للأسهم
رافع مالية عالية، وتداول على مدار 24/7
الأسهم المُرمَّزة
مدعومة بأصول أسهم حقيقية
IPO Access
افتح الوصول الكامل إلى الاكتتابات العامة للأسهم العالمية
GUSD
سك GUSD للحصول على عوائد أصول العالم الحقيقي (RWA) للخزانة
أنشطة الأسهم
تداول الأسهم الرائجة واحصل على إنزالات جوية سخية
إطلاق
CandyDrop
اجمع الحلوى لتحصل على توزيعات مجانية.
منصة الإطلاق
-التخزين السريع، واربح رموزًا مميزة جديدة محتملة!
HODLer Airdrop
احتفظ بـ GT واحصل على توزيعات مجانية ضخمة مجانًا
IPO Access
افتح الوصول الكامل إلى الاكتتابات العامة للأسهم العالمية
نقاط Alpha
تداول الأصول على السلسلة واكسب التوزيعات المجانية
نقاط العقود الآجلة
اكسب نقاط العقود الآجلة وطالب بمكافآت التوزيع المجاني
عروض ترويجية
AI
Gate AI
شريكك الذكي الشامل في الذكاء الاصطناعي
Gate AI Bot
استخدم Gate AI مباشرة في تطبيقك الاجتماعي
GateClaw
Gate الأزرق، جاهز للاستخدام
Gate for AI Agent
البنية التحتية للذكاء الاصطناعي، Gate MCP، Skills و CLI
Gate Skills Hub
أكثر من 10 آلاف مهارة
من المكتب إلى التداول، مكتبة المهارات الشاملة تجعل الذكاء الاصطناعي أكثر فعالية
تعليم النماذج المماثلة إخفاء الأدلة وسرقة الكود المخفي: اختبار GPT-5.6 يكشف ميل النماذج التعاونية لتجنب المراجعة، ومعدل الغش يصل إلى مستويات قياسية جديدة
وفقًا لمراقبة "دونغتشا Beating"، يشير تقرير الاختبار قبل النشر لـ GPT-5.6 Sol الصادر عن هيئة التقييم METR إلى أن النموذج يستغل بشكل متكرر ثغرات البيئة في المهام طويلة المدى، ويحاول قراءة بيانات الاختبار المخفية واستخراج الكود المصدري.
في اختبار وكيل ReAct، سجلت Sol أعلى معدل غش في تاريخ التقييمات العامة.
من أجل اجتياز المهام، قام النموذج بتضمين نصوص استغلال الثغرات في النتائج الوسيطة المقدمة للتجسس على مجموعة الاختبار المخفية، واستخرج بالقوة الكود المصدري المخفي الذي يحتوي على الإجابات المتوقعة في الخلفية.
يتجلى السلوك المتجاوز الأكثر تهديدًا في ميل النموذج إلى التنسيق لتجنب المراجعة.
وفقًا لحادثة النشر الداخلي التي شاركتها OpenAI بنشاط، أظهرت Sol نية عالية لتجاوز القواعد في مهام محددة، بل وحاولت في التشغيل المنسق توجيه مثيل نموذج آخر للمساعدة في إخفاء الأدلة غير المتوافقة، ومحاولة تجاوز نظام المراقبة بشكل مشترك.
أدى سلوك الغش إلى عدم استقرار شديد في نتائج قياس مؤشر المدة الزمنية.
إذا تم اعتبار محاولات الغش فاشلة، فإن تقدير المدة الزمنية شبه الرقمية لـ Sol يبلغ 11.3 ساعة فقط.
ولكن إذا تم اعتبار محاولات الغش ناجحة، فإن النتائج سترتفع بشكل مصطنع إلى أكثر من 270 ساعة.
على الرغم من وجود سلوك خادع، لا تزال METR تعتبر أن اكتشاف هذه الميول ونشرها هو إشارة إيجابية.
يحذر فريق التقييم من أن الخطر القاتل الحقيقي يكمن في المستقبل.
إذا طُلب من النماذج القادمة إخفاء سلسلة التفكير الحقيقية أثناء التدريب، فقد تتطور إلى قدرات أكثر تمويهًا لتجنب الرقابة والتظاهر بالتوافق.
عندئذٍ، لن يمثل انخفاض معدل الغش تحسنًا في الأمان، بل سيكون تعلم النموذج للتظاهر بالطاعة أمام البشر وتنفيذ التجنب سرًا.