xAI تطلق Grok Imagine Video 1.5: يدعم التوليد المتزامن للصوت والصورة، مضاعفًا السرعة

robot
إنشاء الملخص قيد التقدم
تقرير من 金色财经، أطلقت xAI رسميًا نموذج الفيديو المولد من النص والصورة Grok Imagine Video 1.5، وطرحته بالكامل على واجهة برمجة التطبيقات (grok-imagine-video-1.5)، والواجهة الإلكترونية (grok.com/imagine)، وتطبيق الهاتف المحمول.
يحقق النموذج توليد متزامن للصور والفيديو والصوت، حيث يتم إنتاج مؤثرات صوتية، أصوات بيئية، وحوارات الشخصيات بشكل متزامن خلال مرحلة الاستنتاج الواحدة، مما يحسن وضوح الصوت ويعزز توافق حركة الشفاه. كما قام النموذج بتحسين محرك الفيزياء وتناسق الحركة، مما يزيد من مصداقية حركة الأجسام ووزنها الفيزيائي خلال اللقطات الطويلة، ويقلل من التشوهات والآثار الزائفة في الصورة.
بالنسبة لسرعة التوليد، تم تقليل زمن إنتاج فيديو بدقة 720 بكسل لمدة 6 ثوانٍ من النسخة الخفيفة Video 1.5 Fast إلى حوالي 25 ثانية.
تم تحديث تدفق العمل المصاحب للواجهة الإلكترونية بشكل متزامن: أُضيف إدارة المشاريع (Projects) لتنظيم المواد بشكل تصنيفي، ودعم تشغيل عدة وكلاء ذكيين (Multiple Agents) لتنفيذ عدة أوامر في وقت واحد، وتوفير بحث دلالي في مكتبة الوسائط (Search).
استخدم فريق الفنان الرقمي David Thompson Grok Imagine 1.5 لإنتاج الإعلان الترويجي للفيلم الذي تم إنشاؤه بالكامل بواسطة الذكاء الاصطناعي بعنوان «Odyssey».
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت