OpenRouter запустив API для генерації відео, один інтерфейс викликає основні моделі, такі як Sora 2, Veo 3.1, Seedance тощо

robot
Генерація анотацій у процесі

МЕ Новини повідомляють, 16 квітня (UTC+8), згідно з моніторингом Дангча Beating, платформа агрегації моделей штучного інтелекту OpenRouter офіційно запустила API для генерації відео, перша версія підтримує відео на основі тексту та зображень, підключена до Seedance 2.0/1.5, Veo 3.1, Wan 2.7/2.6 та Sora 2 Pro, у майбутньому планується розширення. API для генерації відео значно більш фрагментований у порівнянні з текстовими моделями: різні компанії використовують різні формати запитів, імена параметрів, одиниці оплати, навіть різні можливості в межах однієї сімейства моделей (відео на основі тексту, зображень, генерація ролей за зразком), що часто відповідає різним кінцевим точкам. Підхід OpenRouter полягає у створенні єдиної схеми на верхньому рівні, яка автоматично маршрутизує запити до правильних кінцевих точок залежно від параметрів. Якщо додається зображення — використовується генерація відео з зображення, вказано роль — кінцева точка для узгодженості ролей, розробникам не потрібно турбуватися про внутрішні відмінності. Нормалізація параметрів також охоплює дрібні, але важливі деталі. Наприклад, Veo 3.1 підтримує сегменти довжиною 4, 6, 8 секунд, Wan 2.6 — 5 або 10 секунд, неправильна тривалість викликає помилку. OpenRouter надає кінцеву точку для запиту можливостей моделей /api/v1/videos/models, яка повертає підтримувані роздільну здатність, тривалість, співвідношення сторін, ціну та унікальні параметри кожної моделі, що дозволяє розробникам або автоматизованим агентам перед тестуванням уникнути помилок. Оскільки генерація відео займає кілька хвилин, API працює асинхронно: після подання підказки повертається ID завдання, а відео можна отримати після завершення. OpenRouter також відкрив для спільного використання демонстраційний додаток мульти-модального робочого процесу, що показує послідовність генерації детальних підказок LLM, створення ролей зображеннями та сцен відео моделями. Це і є найпрямішою цінністю після впровадження єдиного маршрутизатора для генерації відео: розробники можуть комбінувати текстові, зображувальні та відео моделі в одному API, без необхідності підключати окремі SDK кожної компанії. (Джерело: BlockBeats)

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити