OpenRouter ra mắt API tạo video, một API gọi Sora 2, Veo 3.1, Seedance và các mô hình chính khác

robot
Đang tạo bản tóm tắt

Tin tức ME News, ngày 16 tháng 4 (UTC+8), theo theo dõi của Động Chấn Beating, nền tảng tổng hợp mô hình AI OpenRouter chính thức ra mắt API tạo video, hỗ trợ ban đầu tạo video dựa trên văn bản và hình ảnh, tích hợp Seedance 2.0/1.5, Veo 3.1, Wan 2.7/2.6 và Sora 2 Pro, sẽ tiếp tục mở rộng trong tương lai. API tạo video bị phân mảnh hơn nhiều so với mô hình văn bản: các yêu cầu của từng nhà khác nhau, đặt tên tham số khác nhau, đơn vị tính phí khác nhau, thậm chí cùng một dòng mô hình có khả năng khác nhau (tạo video dựa trên văn bản, hình ảnh, hoặc tham khảo nhân vật) thường tương ứng với các điểm cuối khác nhau. Cách làm của OpenRouter là xây dựng một schema thống nhất ở tầng trên, tự động định tuyến đến điểm cuối phù hợp dựa trên tham số yêu cầu. Nếu kèm hình ảnh thì sẽ đi điểm cuối tạo video dựa trên hình ảnh, chỉ định nhân vật tham khảo thì đi điểm cuối đảm bảo tính nhất quán của nhân vật, nhà phát triển không cần quan tâm đến sự khác biệt ở tầng dưới. Việc chuẩn hóa tham số cũng bao gồm các chi tiết dễ gây lỗi. Ví dụ, Veo 3.1 hỗ trợ đoạn phim 4, 6, 8 giây, Wan 2.6 hỗ trợ 5 hoặc 10 giây, truyền sai thời lượng sẽ báo lỗi ngay lập tức. OpenRouter cung cấp điểm cuối truy vấn khả năng mô hình /api/v1/videos/models, trả về độ phân giải, thời lượng, tỷ lệ chiều rộng chiều cao, giá cả và các tham số đặc thù của từng mô hình, nhà phát triển hoặc proxy lập trình chỉ cần kiểm tra trước khi gọi để tránh thử sai. Do thời gian tạo video tính bằng phút, API sử dụng chế độ bất đồng bộ: gửi lệnh tạo rồi trả về ID nhiệm vụ, khi hoàn thành sẽ lấy video về. OpenRouter cũng mở mã nguồn một ứng dụng trình diễn quy trình làm việc đa mô hình, thể hiện quá trình LLM tạo ra các lệnh chi tiết, mô hình hình ảnh tạo nhân vật, mô hình video tạo cảnh. Đây cũng là giá trị trực tiếp nhất của việc tích hợp tạo video qua đường dẫn thống nhất: nhà phát triển có thể kết hợp mô hình văn bản, hình ảnh và video trong cùng một API, không cần tích hợp SDK của từng nhà. (Nguồn: BlockBeats)

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim