xAIがGrok Imagine Video 1.5をリリース:音声と映像の同期生成をサポート、速度が倍増

robot
概要作成中
金色财经の報道によると、xAIは正式に画像とテキスト生成の動画モデルGrok Imagine Video 1.5をリリースし、API(grok-imagine-video-1.5)、ウェブサイト(grok.com/imagine)、およびモバイルクライアントで完全に展開されました。
モデルは音声と動画の一体化同期生成を実現し、単一推論段階で効果音、環境音、キャラクターの対話を同時に生成し、音声の明瞭さを向上させ、唇の動きの同期を最適化します。同時に、モデルは物理エンジンと動きの一貫性を改善し、長いカット内での物体の動きと物理的な重さの信頼性を高め、映像の歪みなどのアーティファクトを減少させます。
生成速度に関しては、軽量版のVideo 1.5 Fastは、6秒の720p動画を約25秒で生成できるようになりました。
ウェブ端末のワークフローも同期して更新されました:新たにプロジェクト管理(Projects)が追加され、素材の分類整理を行い、複数のエージェント(Multiple Agents)による複数のプロンプトの並行実行をサポートし、メディアライブラリのセマンティック検索(Search)も提供します。
デジタルアーティストのDavid Thompsonチームは、Grok Imagine 1.5を使用して、完全にAI生成された映画予告編『Odyssey』を制作しました。
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし