تقرير من 金色财经، أطلقت xAI رسميًا نموذج الفيديو المولد من النص والصورة Grok Imagine Video 1.5، وطرحته بالكامل على واجهة برمجة التطبيقات (grok-imagine-video-1.5)، والواجهة الإلكترونية (grok.com/imagine)، وتطبيق الهاتف المحمول.
يحقق النموذج توليد متزامن للصور والفيديو والصوت، حيث يتم إنتاج مؤثرات صوتية، أصوات بيئية، وحوارات الشخصيات بشكل متزامن خلال مرحلة الاستنتاج الواحدة، مما يحسن وضوح الصوت ويعزز توافق حركة الشفاه. كما قام النموذج بتحسين محرك الفيزياء وتناسق الحركة، مما يزيد من مصداقية حركة الأجسام ووزنها الفيزيائي خلال اللقطات الطويلة، ويقلل من التشوهات والآثار الزائفة في الصورة.
بالنسبة لسرعة التوليد، تم تقليل زمن إنتاج فيديو بدقة 720 بكسل لمدة 6 ثوانٍ من النسخة الخفيفة Video 1.5 Fast إلى حوالي 25 ثانية.
تم تحديث تدفق العمل المصاحب للواجهة الإلكترونية بشكل متزامن: أُضيف إدارة المشاريع (Projects) لتنظيم المواد بشكل تصنيفي، ودعم تشغيل عدة وكلاء ذكيين (Multiple Agents) لتنفيذ عدة أوامر في وقت واحد، وتوفير بحث دلالي في مكتبة الوسائط (Search).
استخدم فريق الفنان الرقمي David Thompson Grok Imagine 1.5 لإنتاج الإعلان الترويجي للفيلم الذي تم إنشاؤه بالكامل بواسطة الذكاء الاصطناعي بعنوان «Odyssey».

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

تسجيلات الإعجاب 1

أعجبني
1
تعليق
إعادة النشر
مشاركة

تعليق

إضافة تعليق

لا توجد تعليقات

المواضيع الرائجة
عرض المزيد
#
MyGateTradeStory
692.03K درجة الشعبية
#
TradFiCFDGoldMaster
2.04M درجة الشعبية
#
IsraelStrikesIranBTCPlunges
58.6K درجة الشعبية
#
PredictWorldCup🇺🇸vs🇵🇾
849.97K درجة الشعبية
#
GateSpotVolumeDefiesTrendRanksFirstInGrowthGlobally
68.4M درجة الشعبية

مُثبت

خريطة الموقع

xAI تطلق Grok Imagine Video 1.5: يدعم التوليد المتزامن للصوت والصورة، مضاعفًا السرعة

المواضيع الرائجة

MyGateTradeStory

TradFiCFDGoldMaster

IsraelStrikesIranBTCPlunges

PredictWorldCup🇺🇸vs🇵🇾

GateSpotVolumeDefiesTrendRanksFirstInGrowthGlobally

مُثبت