xAI lança Grok Imagine Video 1.5: suporte à geração de áudio e vídeo sincronizados, velocidade dobrada

robot
Geração do resumo em andamento
Goldfinch News reporta que xAI lançou oficialmente o modelo de geração de vídeo de imagem e texto Grok Imagine Video 1.5, e está disponível integralmente na API (grok-imagine-video-1.5), na versão web (grok.com/imagine) e no aplicativo móvel.
O modelo realiza a geração sincronizada de áudio e vídeo, produzindo efeitos sonoros, sons ambientes e diálogos de personagens simultaneamente na fase de inferência, melhorando a clareza da fala e otimizando a sincronização dos lábios. Além disso, o modelo aprimorou o motor físico e a consistência do movimento, aumentando a credibilidade do movimento de objetos e peso físico ao longo de longos períodos de câmera, reduzindo distorções e artefatos na imagem. Em termos de velocidade de geração, a versão leve Video 1.5 Fast reduz o tempo para gerar um vídeo de 6 segundos em 720p para cerca de 25 segundos.
A atualização do fluxo de trabalho na web também foi sincronizada: foi adicionada a gestão de projetos (Projects) para organizar materiais por categorias, suportando múltiplos agentes (Multiple Agents) executando várias instruções simultaneamente, e oferecendo busca semântica na biblioteca de mídia (Search). O artista digital David Thompson e sua equipe usaram o Grok Imagine 1.5 para criar o trailer de filme totalmente gerado por IA, intitulado "Odyssey".
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado