العقود الآجلة
وصول إلى مئات العقود الدائمة
CFD
الذهب
منصّة واحدة للأصول التقليدية العالمية
الخیارات المتاحة
Hot
تداول خيارات الفانيلا على الطريقة الأوروبية
الحساب الموحد
زيادة كفاءة رأس المال إلى أقصى حد
التداول التجريبي
مقدمة حول تداول العقود الآجلة
استعد لتداول العقود الآجلة
أحداث مستقبلية
"انضم إلى الفعاليات لكسب المكافآت "
التداول التجريبي
استخدم الأموال الافتراضية لتجربة التداول بدون مخاطر
إطلاق
CandyDrop
اجمع الحلوى لتحصل على توزيعات مجانية.
منصة الإطلاق
-التخزين السريع، واربح رموزًا مميزة جديدة محتملة!
HODLer Airdrop
احتفظ بـ GT واحصل على توزيعات مجانية ضخمة مجانًا
Pre-IPOs
افتح الوصول الكامل إلى الاكتتابات العامة للأسهم العالمية
نقاط Alpha
تداول الأصول على السلسلة واكسب التوزيعات المجانية
نقاط العقود الآجلة
اكسب نقاط العقود الآجلة وطالب بمكافآت التوزيع المجاني
عروض ترويجية
AI
Gate AI
شريكك الذكي الشامل في الذكاء الاصطناعي
Gate AI Bot
استخدم Gate AI مباشرة في تطبيقك الاجتماعي
GateClaw
Gate الأزرق، جاهز للاستخدام
Gate for AI Agent
البنية التحتية للذكاء الاصطناعي، Gate MCP، Skills و CLI
Gate Skills Hub
أكثر من 10 آلاف مهارة
من المكتب إلى التداول، مكتبة المهارات الشاملة تجعل الذكاء الاصطناعي أكثر فعالية
GateRouter
ختر بذكاء من أكثر من 40 نموذج ذكاء اصطناعي، بدون أي رسوم إضافية 0%
الجامعة الوطنية في سنغافورة ومعهد نانيانغ التكنولوجي يطلقان Mega-ASR مفتوح المصدر، لتقليل هلوسة وفقدان الكلمات في أنظمة التعرف التلقائي على الكلام تحت الضوضاء الشديدة
أنشأت الفرق البحثية مجموعة بيانات تدريب Voices-in-the-wild-2M تحتوي على 2.4 مليون عينة، بإجمالي 11 ألف ساعة من التسجيلات. تم توليد مجموعة البيانات من خلال خط أنابيب محاكاة يعتمد على خصائص الطيف الفيزيائية، حيث تم تركيب سبعة تأثيرات صوتية أساسية تشمل الارتداد، والصدى، والضوضاء الإضافية، والمجال البعيد، وفقدان التردد، وتقييد النطاق الترددي، وتشويه القص، وتم اشتقاق 54 سيناريو بيئة مركبة. لضمان استقرار التدريب، قام الفريق بعد تصفية العينات التي تتجاوز نسبة أخطاء الكلمات 70%، بضبط توزيع صعوبة مجموعة البيانات من خلال فحص المعقولية الفيزيائية.
في آلية التدريب، أدخل Mega-ASR تقنية Fine-tuning التدريجي من الصوت إلى المعنى A2S-SFT، حيث يتم محاذاة ميزات الصوت على مراحل لتعزيز قدرة النموذج على استعادة المعنى تحت التشويش الشديد. في مرحلة تحسين الاستراتيجية، يستخدم النموذج استراتيجية تحسين معدل أخطاء الكلمات ذات الحبيبتين DG-WGPO لتعزيز التعلم المعزز. عندما يكون جودة الصوت المدخل جيدة، ويكون معدل أخطاء الكلمات منخفضًا، يركز النظام على إعادة بناء التفاصيل الصوتية على مستوى الأحرف. وإذا كان الصوت مشوهًا بشدة، ويكون معدل أخطاء الكلمات مرتفعًا، يتحول آلية القرار إلى إعادة بناء المعنى على مستوى الجملة، مما يقلل بشكل كبير من ظواهر الوهم والحذف الشائعة في النماذج الكبيرة.
لمواجهة انخفاض طفيف محتمل في معدل التعرف في الصوت النظيف، يتضمن Mega-ASR آلية توجيه ديناميكية. يمكن لمحدد التوجيه تقييم جودة الصوت تلقائيًا، واتخاذ قرار ذكي حول ما إذا كان يجب تحميل أوزان Fine-tuning من LoRA، لضمان أن يكون أداء النموذج مثاليًا في البيئات النظيفة والمزعجة على حد سواء. (المصدر: BlockBeats)