xAI phát hành Grok Imagine Video 1.5: Hỗ trợ đồng bộ âm thanh và hình ảnh, tốc độ tăng gấp đôi

robot
Đang tạo bản tóm tắt
Gold Finance đưa tin, xAI chính thức phát hành mô hình tạo video kết hợp hình ảnh và văn bản Grok Imagine Video 1.5, và đã ra mắt toàn diện trên API (grok-imagine-video-1.5), trang web (grok.com/imagine) và ứng dụng di động.
Mô hình thực hiện đồng bộ hóa tạo âm thanh và video, đồng bộ sinh ra hiệu ứng âm thanh, âm thanh môi trường và hội thoại nhân vật trong giai đoạn suy luận đơn lẻ, nâng cao độ rõ của giọng nói và tối ưu hóa đồng bộ môi hình miệng. Đồng thời, mô hình cải tiến động cơ vật lý và tính nhất quán của chuyển động, nâng cao độ tin cậy của chuyển động vật thể và trọng lượng vật lý trong các cảnh quay dài, giảm thiểu biến dạng hình ảnh và các hiệu ứng giả mạo khác. Về tốc độ tạo ra, phiên bản nhẹ Video 1.5 Fast rút ngắn thời gian tạo video 720p dài 6 giây xuống còn khoảng 25 giây.
Cập nhật đồng bộ quy trình làm việc trên trang web: bổ sung quản lý dự án (Projects) để phân loại và sắp xếp tài nguyên, hỗ trợ chạy song song nhiều tác nhân thông minh (Multiple Agents) với nhiều lệnh gợi ý, và cung cấp tìm kiếm ngữ nghĩa trong thư viện phương tiện (Search). Nhóm nghệ sĩ kỹ thuật số David Thompson đã sử dụng Grok Imagine 1.5 để tạo ra trailer phim hoàn toàn do AI sản xuất mang tên 《Odyssey》.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim