العقود الآجلة
وصول إلى مئات العقود الدائمة
TradFi
الذهب
منصّة واحدة للأصول التقليدية العالمية
الخیارات المتاحة
Hot
تداول خيارات الفانيلا على الطريقة الأوروبية
الحساب الموحد
زيادة كفاءة رأس المال إلى أقصى حد
التداول التجريبي
مقدمة حول تداول العقود الآجلة
استعد لتداول العقود الآجلة
أحداث مستقبلية
"انضم إلى الفعاليات لكسب المكافآت "
التداول التجريبي
استخدم الأموال الافتراضية لتجربة التداول بدون مخاطر
إطلاق
CandyDrop
اجمع الحلوى لتحصل على توزيعات مجانية.
منصة الإطلاق
-التخزين السريع، واربح رموزًا مميزة جديدة محتملة!
HODLer Airdrop
احتفظ بـ GT واحصل على توزيعات مجانية ضخمة مجانًا
Pre-IPOs
افتح الوصول الكامل إلى الاكتتابات العامة للأسهم العالمية
نقاط Alpha
تداول الأصول على السلسلة واكسب التوزيعات المجانية
نقاط العقود الآجلة
اكسب نقاط العقود الآجلة وطالب بمكافآت التوزيع المجاني
Runway يدمج الصوت في الفيديو، وأصبح يوم شركات TTS المستقلة أصعب.
الصوت المدمج مباشرة في الفيديو، تسريع التحول إلى المنتج
RunwayML أضافت سرًا صوتًا مخصصًا في واجهة برمجة التطبيقات Characters، وTTS مباشرة في وكيل الفيديو في الوقت الحقيقي. المطورون لم يعودوا بحاجة إلى التعامل مع خدمات الصوت المستقلة بأنفسهم.
هذه طريقة واضحة للربط: نموذج العالم GWM-1 الخاص بـ Runway يربط بين «تحويل النص إلى كلام» وتوليف تعبيرات الوجه، مما يسرع بشكل كبير إنتاج صور افتراضية للعلامة التجارية لخدمة العملاء أو شخصيات الألعاب غير اللاعبين. يعتمد الأساس على ElevenLabs’s eleven_ttv_v3، الذي يمكن تصميم نغمة الصوت باستخدام كلمات تلميحية، أو استنساخ الصوت باستخدام عينة مدتها 10 ثوانٍ، مع تطابق تلقائي لحركات الفم والإيماءات.
إشارة مهمة يجب ملاحظتها: على تويتر، نادرًا ما يناقش أحد، لكن الفريق يقول إن هذه الوظيفة «الأكثر طلبًا من المستخدمين». طريقة الإصدار التي تعتمد على API لا تتبع استراتيجيات التسويق، بل تستهدف الأشخاص الذين يعملون على بناء أشياء حقيقية.
خدمات الصوت المستقلة تواجه ضغطًا هيكليًا
هذه التحديثات وضعت TTS في مستوى «البنية التحتية»، ولم تعد منتجًا مستقلًا. على الرغم من أن ElevenLabs تقدم جهودًا خلف الكواليس، فإن نمط الربط يسرع من اتجاه دمج TTS بشكل «مُدمج».
إصدار ElevenLabs v3 لا يتفوق على المنافسين من حيث التعبير العاطفي والمعايير التقنية، لكن «الأولوية للفيديو» من Runway هي نقطة التحول: الشركات تريد حزمة كاملة من الوكلاء، وليس أجزاء منفصلة. من الطبيعي أن يتجه المطورون نحو منصات متعددة الوسائط ذات بنية كاملة.
لا تنخدع بمصطلحات مثل «النسخ الثوري» — فجودة الصوت لدى الشركات الكبرى ليست بعيدة جدًا، والفرق الحقيقي يكمن في القدرة على الدمج في سيناريوهات متعددة الوسائط.
رأيي: الربط متعدد الوسائط يقلل من عتبة الدخول للمستخدمين غير المتخصصين، وRunway استفادت من تشتت المنافسين وتفردهم.
من منظور الاستثمار، السوق لم يُحسب بعد بشكل كامل على «الأولوية للفيديو + الربط الكامل» الذي يعزز الالتصاق. من ناحية الشركات، تقليل عدد الموردين يوفر المال والجهد.
باختصار: من يسبق في تبني الوكيل الفيديو المدمج، سيكون له ميزة مبكرة. المنصات متعددة الوسائط تستفيد، وTTS المستقلة ستواجه ضغطًا. الشركات التي تتجاهل اتجاه الربط ستُلاحق بشكل سلبي — عندما يصبح «الصوت» القدرة الافتراضية، فإن وتيرة النشر تعتمد على توفر API وتوحيد السلسلة، وليس على جودة الصوت فقط.
الأهمية: متوسطة
التصنيف: إصدار المنتج|اتجاهات الصناعة|أدوات المطورين
الاستنتاج: مطورو المنتجات والمشتريات المؤسسية في «المرحلة المبكرة»، ويجب التحقق بسرعة من إمكانية الدخول. المستثمرون والشركات التي تركز فقط على الصوت الآن في «فترة الحماية»، ويجب أن يسرعوا نحو الوسائط المتعددة والقدرة على الدمج. الموارد ستتجه نحو المنصات المتكاملة والفرق التي يمكنها تسريع الإنتاج، بينما اللاعبون في TTS المنفرد لن يكونوا في وضع مميز على المدى القصير.