OpenRouter запустил API для генерации видео, один интерфейс вызывает основные модели, такие как Sora 2, Veo 3.1, Seedance и другие

robot
Генерация тезисов в процессе

ME News Новости, 16 апреля (UTC+8), согласно мониторингу 动察 Beating, платформа агрегирования моделей ИИ OpenRouter официально запустила API для генерации видео, первая версия поддерживает видео на основе текста и изображений, подключена к Seedance 2.0/1.5, Veo 3.1, Wan 2.7/2.6 и Sora 2 Pro, в дальнейшем планируется расширение. API для генерации видео значительно более фрагментирован, чем текстовые модели: у разных провайдеров разные форматы запросов, разные названия параметров, разные единицы оплаты, и даже разные возможности внутри одной семейства моделей (генерация видео по тексту, по изображению, создание по референсным ролям) часто используют разные конечные точки. Подход OpenRouter заключается в создании верхнего уровня с единым схемой, которая автоматически маршрутизирует запросы к правильной конечной точке в зависимости от параметров. Если есть изображение — используется генерация видео по изображению, если указана референсная роль — используется конечная точка для согласованности ролей, разработчикам не нужно заботиться о различиях на нижнем уровне. Нормализация параметров также охватывает тонкие детали, в которых легко ошибиться. Например, Veo 3.1 поддерживает сегменты по 4, 6, 8 секунд, Wan 2.6 — 5 или 10 секунд, неправильная длительность вызывает ошибку. OpenRouter предоставляет конечную точку для запроса возможностей моделей /api/v1/videos/models, которая возвращает поддерживаемое разрешение, длительность, соотношение сторон, ценообразование и уникальные параметры каждой модели, разработчики или автоматизированные скрипты могут проверить это перед вызовом, чтобы избежать ошибок. Поскольку генерация видео занимает минуты, API работает асинхронно: после отправки подсказки возвращается ID задачи, по завершении можно получить готовое видео. OpenRouter также выпустил демонстрационное приложение для мульти-модального рабочего процесса, показывающее последовательность: генерация подробных подсказок с помощью LLM, создание ролей изображениями, генерация сцен видео моделями. Это и есть наиболее очевидная ценность объединенного маршрутизатора для генерации видео: разработчики могут комбинировать текстовые, изображенческие и видео модели через один API, без необходимости подключать отдельные SDK каждой компании. (Источник: BlockBeats)

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить