العقود الآجلة
وصول إلى مئات العقود الدائمة
CFD
الذهب
منصّة واحدة للأصول التقليدية العالمية
الخیارات المتاحة
Hot
تداول خيارات الفانيلا على الطريقة الأوروبية
الحساب الموحد
زيادة كفاءة رأس المال إلى أقصى حد
التداول التجريبي
مقدمة حول تداول العقود الآجلة
استعد لتداول العقود الآجلة
أحداث مستقبلية
"انضم إلى الفعاليات لكسب المكافآت "
التداول التجريبي
استخدم الأموال الافتراضية لتجربة التداول بدون مخاطر
إطلاق
CandyDrop
اجمع الحلوى لتحصل على توزيعات مجانية.
منصة الإطلاق
-التخزين السريع، واربح رموزًا مميزة جديدة محتملة!
HODLer Airdrop
احتفظ بـ GT واحصل على توزيعات مجانية ضخمة مجانًا
Pre-IPOs
افتح الوصول الكامل إلى الاكتتابات العامة للأسهم العالمية
نقاط Alpha
تداول الأصول على السلسلة واكسب التوزيعات المجانية
نقاط العقود الآجلة
اكسب نقاط العقود الآجلة وطالب بمكافآت التوزيع المجاني
عروض ترويجية
AI
Gate AI
شريكك الذكي الشامل في الذكاء الاصطناعي
Gate AI Bot
استخدم Gate AI مباشرة في تطبيقك الاجتماعي
GateClaw
Gate الأزرق، جاهز للاستخدام
Gate for AI Agent
البنية التحتية للذكاء الاصطناعي، Gate MCP، Skills و CLI
Gate Skills Hub
أكثر من 10 آلاف مهارة
من المكتب إلى التداول، مكتبة المهارات الشاملة تجعل الذكاء الاصطناعي أكثر فعالية
GateRouter
ختر بذكاء من أكثر من 40 نموذج ذكاء اصطناعي، بدون أي رسوم إضافية 0%
شاومي تفتح مصدر OmniVoice: نموذج يغطّي 646 لغة في استنساخ الصوت، تدريب بيانات مفتوحة المصدر يفوز على أنظمة تجارية
وفقًا لمراقبة الضربات Beating، قام فريق Xiaomi AI Lab بإطلاق OmniVoice، وهو نموذج نص-إلى-صوت (TTS) يدعم 646 لغة، ويُعد الجيل الجديد من فريق Kaldi مفتوح المصدر. يمكنه استنساخ الصوت باستخدام بضع ثوانٍ من الصوت المرجعي، ويعمل عبر اللغات: أعطِه تسجيلًا صوتيًا باللغة الصينية، ويمكنه التحدث بنفس الصوت باللغة اليابانية أو الكورية أو لغات أخرى. الكود والأوزان وبيانات التدريب كلها مفتوحة المصدر، برخصة Apache-2.0.
من حيث الهيكل، يتبع OmniVoice نهج البساطة المطلقة. النموذج يتكون من محول ثنائي الاتجاه واحد، ويقوم مباشرة بتحويل النص إلى رموز صوتية مشفرة بشكل متعدد (ترميز صوتي منفصل)، دون الحاجة إلى خطوتين متتاليتين لتحويل الرموز الدلالية ثم الرموز الصوتية. يدعمان تصميمان رئيسيان هذا الهيكل البسيط: استراتيجية إخفاء عشوائية للرموز المشفرة تعزز كفاءة التدريب، واستخدام معلمات ما قبل التدريب لنموذج لغة كبير لتحسين دقة النطق. سرعة الاستنتاج 40 مرة أسرع من الوقت الحقيقي، ويعمل مباشرة على PyTorch دون الحاجة إلى تحسينات إضافية.
جميع بيانات التدريب من 50 مجموعة بيانات صوتية مفتوحة المصدر، بعد تصفية الضوضاء والجودة، تصل إلى 580 ألف ساعة. لضمان أداء جيد لللغات ذات الموارد المنخفضة، يتم استخدام تقنية الزيادة الديناميكية للعينات. في اختبارات 24 لغة، تفوق صوت OmniVoice في التشابه الصوتي والوضوح على العديد من الأنظمة التجارية. وفي اختبارات 102 لغة، يقترب أو يتفوق على التسجيلات الحقيقية من حيث الوضوح. حتى اللغات ذات الموارد أقل من 10 ساعات يمكنها توليف الصوت منها.
بالإضافة إلى استنساخ الصوت، يدعم النموذج تخصيص الصوت عبر وصف نصي (مثل “ذكر، متوسط العمر، نغمة منخفضة جدًا” أو “أنثى، شابة، لهجة سيتشوان”)، وتقليل الضوضاء تلقائيًا باستخدام الصوت المرجعي، وإدراج رموز التعبير مثل الضحك والتنهد، وتصحيح نطق الأحرف الصينية متعددة النطق والأسماء الخاصة باللغة الإنجليزية والصينية.