العقود الآجلة
وصول إلى مئات العقود الدائمة
CFD
الذهب
منصّة واحدة للأصول التقليدية العالمية
الخیارات المتاحة
Hot
تداول خيارات الفانيلا على الطريقة الأوروبية
الحساب الموحد
زيادة كفاءة رأس المال إلى أقصى حد
التداول التجريبي
مقدمة حول تداول العقود الآجلة
استعد لتداول العقود الآجلة
أحداث مستقبلية
"انضم إلى الفعاليات لكسب المكافآت "
التداول التجريبي
استخدم الأموال الافتراضية لتجربة التداول بدون مخاطر
إطلاق
CandyDrop
اجمع الحلوى لتحصل على توزيعات مجانية.
منصة الإطلاق
-التخزين السريع، واربح رموزًا مميزة جديدة محتملة!
HODLer Airdrop
احتفظ بـ GT واحصل على توزيعات مجانية ضخمة مجانًا
Pre-IPOs
افتح الوصول الكامل إلى الاكتتابات العامة للأسهم العالمية
نقاط Alpha
تداول الأصول على السلسلة واكسب التوزيعات المجانية
نقاط العقود الآجلة
اكسب نقاط العقود الآجلة وطالب بمكافآت التوزيع المجاني
عروض ترويجية
AI
Gate AI
شريكك الذكي الشامل في الذكاء الاصطناعي
Gate AI Bot
استخدم Gate AI مباشرة في تطبيقك الاجتماعي
GateClaw
Gate الأزرق، جاهز للاستخدام
Gate for AI Agent
البنية التحتية للذكاء الاصطناعي، Gate MCP، Skills و CLI
Gate Skills Hub
أكثر من 10 آلاف مهارة
من المكتب إلى التداول، مكتبة المهارات الشاملة تجعل الذكاء الاصطناعي أكثر فعالية
GateRouter
ختر بذكاء من أكثر من 40 نموذج ذكاء اصطناعي، بدون أي رسوم إضافية 0%
هل يمكن للذكاء الاصطناعي أن يحل محل المحللين الماليين؟
اختبار إصدار Vals AI الجديد فشل تمامًا،
نسبة دقة GPT 5.5 بالكاد تتجاوز النصف
AIMPACT رسالة، 14 مايو (UTC+8)، وفقًا لمراقبة 动察 Beating، أصدرت وكالة تقييم الذكاء الاصطناعي Vals AI اختبار المعيار للجيل الثاني من الوكيل المالي (Finance Agent v2). هذا اختبار شامل يحاكي سير عمل محلل مالي مبتدئ، ويشمل 927 سؤال مراجعة من قبل خبراء. زادت صعوبة الاختبار بشكل كبير في الإصدار الجديد، حيث حقق GPT 5.5 دقة بنسبة 51.76% فقط وتصدر الترتيب، متساويًا مع Claude Opus 4.7 (51.51%) وClaude Sonnet 4.6 (51.03%).
على عكس الأسئلة ذات الجولة الواحدة، يتطلب هذا الاختبار من النموذج البحث بشكل مستقل عن الفقرات ذات الصلة في تقارير 10-K و10-Q المالية التي تمتد لمئات الصفحات، ومعالجة التعديلات على البيانات المالية عبر السنوات، وإجراء حسابات متعددة الخطوات مع أرقام وسطية دقيقة.
كشفت Vals AI أنه إذا تم اعتماد معيار تقييم صارم يتطلب الإجابة الصحيحة تمامًا، فإن دقة جميع النماذج المتقدمة ستنخفض إلى أقل من 40%؛ وفي فئتي “النمذجة المالية” و"تحليل السوابق"، كانت أعلى درجة فقط 23%.
أما بالنسبة للنماذج الأخرى، فاحتل Kimi K2.6 المركز الخامس بنسبة 44.87%، وهو أعلى نموذج محلي من حيث الأداء؛ يليه GLM 5.1 بنسبة 44.79% وDeepSeek V4 بنسبة 44.08%.
بالإضافة إلى ذلك، منحت الجهة الرسمية علامة “الأسرع سرعة” لـClaude Opus 4.7 (زمن استغراق كل عملية 360 ثانية)، وحصلت GLM 5.1 على علامة “الأكثر توفيرًا للميزانية” (تكلفة كل عملية 0.62 دولار).
أظهر تراجع نتائج الاختبار الجماعي (حيث كانت نتيجة Opus 4.7 في الجيل السابق 64.4%) أن شيئًا واحدًا واضح: الذكاء الاصطناعي الحالي يمكنه التعامل مع البحث البسيط، لكنه لا يزال بعيدًا عن القدرة على استبدال المحللين الماليين في المناطق العميقة من التمويل التي تتطلب الالتزام بالمعايير الصناعية الدقيقة والدقة العالية في الأرقام.
(المصدر: BlockBeats)