xAI merilis Grok Imagine Video 1.5: Mendukung pembuatan audio dan gambar sinkron secara bersamaan, kecepatan meningkat dua kali lipat

robot
Pembuatan abstrak sedang berlangsung
Keuangan Emas melaporkan, xAI secara resmi merilis model video generasi gambar dan teks Grok Imagine Video 1.5, dan telah diluncurkan secara penuh di API (grok-imagine-video-1.5), platform web (grok.com/imagine), serta aplikasi seluler.
Model ini mewujudkan sinkronisasi pembuatan audio dan video secara terpadu, secara bersamaan menghasilkan efek suara, suara latar, dan dialog karakter selama tahap inferensi tunggal, meningkatkan kejernihan suara dan mengoptimalkan sinkronisasi bibir. Selain itu, model ini memperbaiki mesin fisika dan konsistensi gerak, meningkatkan kepercayaan terhadap gerakan objek dan bobot fisik dalam siklus panjang pengambilan gambar, serta mengurangi distorsi gambar dan artefak lainnya.
Dalam hal kecepatan pembuatan, versi ringan Video 1.5 Fast mengurangi waktu pembuatan video 720p selama 6 detik menjadi sekitar 25 detik.
Alur kerja pendukung di platform web juga diperbarui secara bersamaan: menambahkan manajemen proyek (Projects) untuk mengkategorikan dan mengatur materi, mendukung jalannya beberapa agen secara paralel (Multiple Agents) untuk menjalankan beberapa prompt, dan menyediakan pencarian semantik di perpustakaan media (Search).
Seniman digital David Thompson dan timnya menggunakan Grok Imagine 1.5 untuk membuat trailer film yang sepenuhnya dihasilkan oleh AI berjudul "Odyssey".
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan