xAI lança Grok Imagine Video 1.5: suporte à geração sincronizada de áudio e vídeo, velocidade duplicada

robot
Geração de resumo em curso
Golden Finance relata que a xAI lançou oficialmente o modelo de geração de vídeo de imagem e texto Grok Imagine Video 1.5, disponível na API (grok-imagine-video-1.5), na versão web (grok.com/imagine) e no aplicativo móvel.
O modelo realiza a geração integrada de áudio e vídeo de forma sincronizada, produzindo efeitos sonoros, sons ambientes e diálogos de personagens simultaneamente durante uma única inferência, melhorando a clareza da voz e otimizando a sincronização dos lábios. Além disso, o modelo aprimorou o motor físico e a consistência do movimento, aumentando a credibilidade do movimento de objetos e peso físico ao longo de longos períodos de filmagem, reduzindo distorções e artefatos visuais. No que diz respeito à velocidade de geração, a versão leve Video 1.5 Fast reduz o tempo para gerar um vídeo de 6 segundos em 720p para cerca de 25 segundos.
A atualização do fluxo de trabalho na versão web também foi sincronizada: foi adicionada a gestão de projetos (Projects) para organizar materiais por categorias, suportando múltiplos agentes (Multiple Agents) executando várias instruções simultaneamente, além de oferecer busca semântica na biblioteca de mídia (Search). O artista digital David Thompson e sua equipe usaram o Grok Imagine 1.5 para criar o trailer de filme totalmente gerado por IA intitulado "Odyssey".
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado