OpenRouter lança API de geração de vídeos, uma interface que chama os principais modelos como Sora 2, Veo 3.1, Seedance e outros

robot
Geração de resumo em curso

Notícias ME, 16 de abril (UTC+8), de acordo com o monitoramento do Beating, a plataforma de agregação de modelos de IA OpenRouter lançou oficialmente a API de geração de vídeos, suportando inicialmente vídeos baseados em texto e imagens, integrando Seedance 2.0/1.5, Veo 3.1, Wan 2.7/2.6 e Sora 2 Pro, com expansão futura prevista.
A fragmentação de APIs na área de geração de vídeos é muito maior do que na de modelos de texto: formatos de requisição diferentes, nomes de parâmetros distintos, unidades de cobrança variadas, e até mesmo diferentes capacidades dentro da mesma família de modelos (vídeo baseado em texto, vídeo a partir de imagem, geração de personagens de referência) frequentemente correspondendo a endpoints diferentes.
A abordagem do OpenRouter é criar uma camada superior com um esquema unificado, que roteia automaticamente para o endpoint correto com base nos parâmetros da requisição.
Se incluir uma imagem, a requisição é direcionada para geração de vídeo a partir de imagem; se especificar um personagem de referência, ela vai para o endpoint de consistência de personagem; os desenvolvedores não precisam se preocupar com as diferenças subjacentes.
A normalização dos parâmetros também cobre detalhes que costumam causar problemas.
Por exemplo, o Veo 3.1 suporta trechos de 4, 6 ou 8 segundos, enquanto o Wan 2.6 suporta 5 ou 10 segundos, e uma duração incorreta gera erro direto.
O OpenRouter fornece um endpoint de consulta de capacidades do modelo /api/v1/videos/models\ que retorna a resolução, duração, proporção, preços e parâmetros específicos de cada modelo suportado, permitindo que desenvolvedores ou proxies de programação consultem antes de testar, evitando tentativas frustradas.
Como a geração de vídeos leva minutos, a API opera de forma assíncrona: após enviar a solicitação, retorna um ID de tarefa, e o vídeo pode ser recuperado após a conclusão.
O OpenRouter também lançou um aplicativo de demonstração de fluxo de trabalho multimodal de código aberto, exibindo o encadeamento de geração de prompts detalhados por LLM, geração de personagens por modelos de imagem e geração de cenas por modelos de vídeo.
Essa é a vantagem mais direta de uma rota unificada para geração de vídeos: os desenvolvedores podem combinar modelos de texto, imagem e vídeo na mesma API, sem precisar integrar SDKs de diferentes fornecedores.
(Fonte: BlockBeats)

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar