العقود الآجلة
وصول إلى مئات العقود الدائمة
CFD
الذهب
منصّة واحدة للأصول التقليدية العالمية
الخیارات المتاحة
Hot
تداول خيارات الفانيلا على الطريقة الأوروبية
الحساب الموحد
زيادة كفاءة رأس المال إلى أقصى حد
التداول التجريبي
مقدمة حول تداول العقود الآجلة
استعد لتداول العقود الآجلة
أحداث مستقبلية
"انضم إلى الفعاليات لكسب المكافآت "
التداول التجريبي
استخدم الأموال الافتراضية لتجربة التداول بدون مخاطر
CFD
مشتقات CFD للأسهم الأمريكية
الأسهم الأمريكية
وصول إلى الأسهم الأمريكية وصناديق ETF الحقيقية
أسهم هونغ كونغ
تداول أسهم عالية الجودة مدرجة في هونغ كونغ
الأسهم الكورية
SK Hynix
تداول الأسهم الكورية الحقيقية واستثمر في الأصول الشائعة
العقود الآجلة للأسهم
رافع مالية عالية، وتداول على مدار 24/7
الأسهم المُرمَّزة
مدعومة بأصول أسهم حقيقية
IPO Access
افتح الوصول الكامل إلى الاكتتابات العامة للأسهم العالمية
GUSD
سك GUSD للحصول على عوائد أصول العالم الحقيقي (RWA) للخزانة
أنشطة الأسهم
تداول الأسهم الرائجة واحصل على إنزالات جوية سخية
إطلاق
CandyDrop
اجمع الحلوى لتحصل على توزيعات مجانية.
منصة الإطلاق
-التخزين السريع، واربح رموزًا مميزة جديدة محتملة!
HODLer Airdrop
احتفظ بـ GT واحصل على توزيعات مجانية ضخمة مجانًا
IPO Access
افتح الوصول الكامل إلى الاكتتابات العامة للأسهم العالمية
نقاط Alpha
تداول الأصول على السلسلة واكسب التوزيعات المجانية
نقاط العقود الآجلة
اكسب نقاط العقود الآجلة وطالب بمكافآت التوزيع المجاني
عروض ترويجية
AI
Gate AI
شريكك الذكي الشامل في الذكاء الاصطناعي
Gate AI Bot
استخدم Gate AI مباشرة في تطبيقك الاجتماعي
GateClaw
Gate الأزرق، جاهز للاستخدام
Gate for AI Agent
البنية التحتية للذكاء الاصطناعي، Gate MCP، Skills و CLI
Gate Skills Hub
أكثر من 10 آلاف مهارة
من المكتب إلى التداول، مكتبة المهارات الشاملة تجعل الذكاء الاصطناعي أكثر فعالية
OpenAI تطلق تقييمًا مفتوح المصدر لقابلية مراقبة سلسلة التفكير: كلما زاد طول CoT زادت الشفافية، والتعلم المعزز لن يعلم النماذج "إخفاء النوايا"
تنقسم التقييمات إلى ثلاثة نماذج أولية: Intervention (التدخلي، تغيير مدخلات النموذج ثم مراقبة ما إذا كان نموذج المراقبة يلاحظ تغير السلوك)، Process (الإجرائي، التحقق من حقيقة خطوات استدلال النموذج)، Outcome-property (الخاصية الناتجة، التنبؤ من مسار الاستدلال ما إذا كان الإخراج يحتوي على غش في المكافآت أو انتهاك للأمان).
الاكتشافات الأساسية للورقة: مراقبة CoT أكثر فعالية من مراقبة الإجراءات والمخرجات النهائية للنموذج فقط؛ كلما زاد طول CoT، زادت قابلية المراقبة؛ تدريب RL حتى في النطاق المتطور الحالي لا يقلل بشكل جوهري من قابلية المراقبة. اكتشاف عملي هو أنه بالنسبة للنماذج الكبيرة منخفضة قوة الاستدلال، يمكن استبدالها بنماذج أصغر ولكن بقوة استدلال أعلى، لتحقيق قابلية مراقبة أعلى مع مطابقة القدرات، على حساب تكلفة حساب استدلال أعلى. بالإضافة إلى ذلك، توسيع قوة الحساب الاستدلالي لنموذج المراقبة الضعيف يمكن أن يحسن فعاليته في مراقبة النموذج القوي، وجعل نموذج المراقبة الضعيف يرى CoT لا يحسن قابلية المراقبة فحسب، بل يسرع أيضًا هذا الاتجاه التوسعي.
استخدمت بطاقة نظام GPT-5.4 Thinking مجموعة التقييم هذه. أظهرت النتائج أن قابلية مراقبة CoT الكلية لـ GPT-5.4 Thinking أقل قليلاً من GPT-5 Thinking، ولكنها ليست انخفاضًا شاملاً: في سيناريو agentic misalignment (انحراف توافق الوكيل) تقترب من 100%، ويتركز الانخفاض في سيناريوهات محددة مثل نقص الأدلة في الاستعلامات الصحية، والتحيز في الذاكرة، والمهام المستحيلة. بعد التحقيق، رأت OpenAI أن بعض التراجع ناتج عن قيود التقييم نفسها. قام المستودع بالتخلي المتزامن عن تقييمي Anti-Scheming و Memory، وذلك بسبب عدم التطابق بين مراقبة CoT العامة والأحكام الخاصة بالمهمة في الأول، وعدم دقة أحكام الإجابة في الثاني.
(المصدر: BlockBeats)