العقود الآجلة
وصول إلى مئات العقود الدائمة
CFD
الذهب
منصّة واحدة للأصول التقليدية العالمية
الخیارات المتاحة
Hot
تداول خيارات الفانيلا على الطريقة الأوروبية
الحساب الموحد
زيادة كفاءة رأس المال إلى أقصى حد
التداول التجريبي
مقدمة حول تداول العقود الآجلة
استعد لتداول العقود الآجلة
أحداث مستقبلية
"انضم إلى الفعاليات لكسب المكافآت "
التداول التجريبي
استخدم الأموال الافتراضية لتجربة التداول بدون مخاطر
إطلاق
CandyDrop
اجمع الحلوى لتحصل على توزيعات مجانية.
منصة الإطلاق
-التخزين السريع، واربح رموزًا مميزة جديدة محتملة!
HODLer Airdrop
احتفظ بـ GT واحصل على توزيعات مجانية ضخمة مجانًا
Pre-IPOs
افتح الوصول الكامل إلى الاكتتابات العامة للأسهم العالمية
نقاط Alpha
تداول الأصول على السلسلة واكسب التوزيعات المجانية
نقاط العقود الآجلة
اكسب نقاط العقود الآجلة وطالب بمكافآت التوزيع المجاني
عروض ترويجية
AI
Gate AI
شريكك الذكي الشامل في الذكاء الاصطناعي
Gate AI Bot
استخدم Gate AI مباشرة في تطبيقك الاجتماعي
GateClaw
Gate الأزرق، جاهز للاستخدام
Gate for AI Agent
البنية التحتية للذكاء الاصطناعي، Gate MCP، Skills و CLI
Gate Skills Hub
أكثر من 10 آلاف مهارة
من المكتب إلى التداول، مكتبة المهارات الشاملة تجعل الذكاء الاصطناعي أكثر فعالية
GateRouter
ختر بذكاء من أكثر من 40 نموذج ذكاء اصطناعي، بدون أي رسوم إضافية 0%
أطلقت LangSmith أكثر من 30 نموذج تقييم، ولم يعد من الضروري بدء اختبار جودة الوكيل الذكي من الصفر
تقييم مدى «فاعلية» وكيل الذكاء الاصطناعي هو أحد أكثر المراحل استهلاكًا للوقت في عملية التطوير حاليًا.
قد يستدعي الوكيل الأدوات الصحيحة لكن بصيغة إجابة غير مناسبة، أو يكون الحوار الأحادي طبيعيًا لكن يتعطل في المحادثات متعددة الأدوار، أو تكون الإجابة النهائية معقولة لكن تم استرجاع مستندات خاطئة خلال الخطوات الوسيطة.
يحتاج المطورون إلى وضع نقاط فحص على مستويات متعددة مثل خطوة واحدة، مسار كامل، محادثة متعددة الأدوار، استدعاء أدوات محددة، وكل تقييم يمر بكتابة التعليمات، ومعايرتها مقابل البيانات الحقيقية، وتحسينها بشكل متكرر، وغالبًا ما يستغرق الأمر أسابيع من البداية.
تقدم LangSmith الآن أكثر من 30 قالبًا جاهزًا، تغطي خمسة فئات: الأمان والحماية (كشف حقن التعليمات، فحص تسرب المعلومات الشخصية، التحيز والسمية)، جودة الإجابة (الصحة، الفائدة، النغمة)، مسار التنفيذ (هل اتبع الوكيل الخطوات الصحيحة)، تحليل سلوك المستخدم (توزيع اللغة، إشارات الرضا)، والوسائط المتعددة (مراجعة إخراج الصوت والصورة).
تحتوي القوالب على تعليمات تقييم محسنة لنماذج اللغة الكبيرة (LLM) وأكواد تقييم قائمة على القواعد، يمكن استخدامها مباشرة أو تعديلها حسب الحاجة، وتناسب المراقبة عبر الإنترنت والتجارب غير المتصلة.
أما المقيم القابل لإعادة الاستخدام فهو يحل مشكلة إدارة المستويات التنظيمية:
تبويب Evaluators الجديد يعرض جميع المقيمين في مساحة العمل بشكل مركزي، ويمكن ربطه بمشروع جديد بنقرة واحدة، وتحديث التعليمات ليصبح ساري المفعول على مستوى العالم، دون الحاجة لصيانة نسخ مكررة في كل مشروع.
تم إصدار القوالب المذكورة أعلاه كمصدر مفتوح مع إصدار openevals v0.2.0، مع دعم تقييم الوسائط المتعددة الجديد.
(المصدر: BlockBeats)