xAI випустила Grok Imagine Video 1.5: підтримка одночасного створення аудіо та відео, швидкість подвоєна

robot
Генерація анотацій у процесі
Золотий фінансовий звіт повідомляє, що xAI офіційно випустила модель для створення відео з тексту та зображень Grok Imagine Video 1.5, яка повністю доступна через API (grok-imagine-video-1.5), веб-інтерфейс (grok.com/imagine) та мобільний додаток.
Модель реалізує інтегроване одночасне створення аудіо та відео, одночасно генеруючи звукові ефекти, навколишній шум і діалоги персонажів під час одного етапу обчислень, підвищуючи чіткість голосу та покращуючи синхронізацію губ. Також модель покращила фізичний движок і узгодженість руху, підвищуючи достовірність руху об'єктів і фізичної ваги протягом довгих кадрів, зменшуючи спотворення зображення та інші артефакти.
Щодо швидкості створення, легка версія Video 1.5 Fast скорочує час генерації 6-секундного відео у роздільній здатності 720p до приблизно 25 секунд.
Паралельно оновлено робочий процес для веб-інтерфейсу: додано управління проектами (Projects) для класифікації та організації матеріалів, підтримка одночасної роботи кількох агентів (Multiple Agents) з різними підказками, а також семантичний пошук у медіа-бібліотеці (Search).
Цифровий художник Дейвід Томпсон і його команда використали Grok Imagine 1.5 для створення повністю AI-згенерованого трейлера до фільму «Odyssey».
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено