xAI publie Grok Imagine Video 1.5 : support de la génération synchronisée audio-vidéo, vitesse doublée

robot
Création du résumé en cours
Gold Finance rapporte que xAI a officiellement lancé le modèle de génération d'images et de textes en vidéo Grok Imagine Video 1.5, disponible sur l'API (grok-imagine-video-1.5), la plateforme web (grok.com/imagine) et l'application mobile.
Le modèle réalise une génération synchronisée audio-vidéo intégrée, produisant simultanément effets sonores, bruitages environnementaux et dialogues de personnages lors de l'inférence unique, améliorant la clarté de la voix et la synchronisation des lèvres.
Par ailleurs, le modèle a amélioré le moteur physique et la cohérence du mouvement, renforçant la crédibilité du mouvement des objets et de leur poids physique sur de longues périodes de caméra, tout en réduisant les distorsions d'image et autres artefacts.
En termes de vitesse de génération, la version allégée Video 1.5 Fast réduit le temps nécessaire pour produire une vidéo de 6 secondes en 720p à environ 25 secondes.
La mise à jour du flux de travail sur la plateforme web comprend une nouvelle gestion de projets (Projects) pour organiser les matériaux, la prise en charge de l'exécution parallèle de plusieurs prompts avec plusieurs agents (Multiple Agents), ainsi qu'une recherche sémantique dans la médiathèque (Search).
L'équipe de l'artiste numérique David Thompson a utilisé Grok Imagine 1.5 pour réaliser la bande-annonce entièrement générée par l'IA du film « Odyssey ».
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé