xAI выпустила Grok Imagine Video 1.5: поддержка одновременного синхронного создания звука и изображения, скорость в два раза выше

robot
Генерация тезисов в процессе
Цзиньсэ Цзяоцзин сообщает, что xAI официально выпустила модель для генерации изображений и текста в видео Grok Imagine Video 1.5, а также полностью запустила её на API (grok-imagine-video-1.5), веб-странице (grok.com/imagine) и мобильных клиентах.
Модель реализует синхронное создание аудио и видео, одновременно генерируя звуковые эффекты, окружающий звук и диалоги персонажей на этапе одного вывода, повышая четкость речи и оптимизируя синхронность губ. Также модель улучшила физический движок и согласованность движений, повышая достоверность движения объектов и физического веса в длинных кадрах, уменьшая искажения и артефакты. В скорости генерации облегченная версия Video 1.5 Fast сокращает время на создание 6-секундного видео в 720p до примерно 25 секунд.
Обновление связанного рабочего процесса на веб-странице: добавлено управление проектами (Projects) для организации материалов по категориям, поддержка параллельной работы нескольких агентов (Multiple Agents) с несколькими подсказками, а также семантический поиск в медиабиблиотеке (Search). Команда цифрового художника Дэвида Томпсона использовала Grok Imagine 1.5 для создания полностью AI-сгенерированного трейлера фильма «Одиссея».
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено