O modelo de vídeo viral foi de repente encerrado! Grandes altos e baixos, qual é a razão?

robot
Geração de resumo em curso

Recentemente, a OpenAI anunciou a suspensão do seu aplicativo independente do Sora, da interface de API e da funcionalidade de vídeo incorporada no ChatGPT, saindo de forma completa do mercado de geração de vídeo com IA para consumidores. (Notícia: o Sora será encerrado) Há análises que apontam que a principal razão para o encerramento apressado do Sora apenas meio ano após o lançamento foi a falta de procura rígida e a receita aquém das expectativas. Como é que a área dos vídeos com IA pode manter uma vitalidade duradoura? Este é o foco de atenção de todos.

Ao analisar as contagens de descarregamentos do Sora, verificámos que, em setembro de 2025, quando foi oficialmente lançado, cinco dias após a estreia ultrapassou um milhão de descarregamentos, subindo rapidamente para o primeiro lugar da lista gratuita das app stores, e a popularidade chegou mesmo a exceder a do ChatGPT no mesmo período. No entanto, este fervor não durou muito: em menos de três meses, os descarregamentos caíram 32% em termos mês a mês; em janeiro deste ano, os descarregamentos voltaram a despenhar-se 45%. Em fevereiro, os descarregamentos do Sora já tinham descido para fora do top 100 da lista geral de aplicações gratuitas.

Numa plataforma social, vimos um post com o seguinte conteúdo: “Nas duas primeiras semanas desde o lançamento, eu e a minha família usámos o Sora para fazer mais de 100 vídeos. Isso despertou a nossa criatividade e a nossa alegria verdadeiras. Mas duas semanas depois, já não o abrimos nunca mais. Achamos que é aí que está o verdadeiro fracasso do Sora.”

Este post gerou uma grande ressonância por parte dos utilizadores, e muitos afirmaram que o Sora se parece mais com um “brinquedo novidade”, sendo difícil transformá-lo numa ferramenta para resolver problemas reais do dia a dia.

Li Piji, professor da Escola de Inteligência Artificial da Universidade de Aviação e Astronáutica de Nanjing: quando um novo modelo grande é lançado, atrai muitos utilizadores para experimentar. Embora estas funcionalidades sejam ricas e interessantes, como não foram integradas nos fluxos de trabalho diários dos utilizadores, também não conseguem resolver problemas de procura frequente e exigente na vida quotidiana. Isto leva a uma descida acentuada da actividade de utilização do software, criando o fenómeno de uma “flor de um dia”.

Especialistas disseram ao repórter que, à medida que a actividade do software continua a cair, a taxa de retenção dos utilizadores e a procura rígida por parte dos utilizadores também diminuem continuamente. Contudo, custos elevados como o aluguer de GPU, os custos de electricidade e as despesas de inferência não baixaram na mesma proporção. De acordo com cálculos de uma instituição de análise, o custo médio diário de funcionamento do Sora é de 15 milhões de dólares, gastando cerca de 5,4 mil milhões de dólares por ano. Para gerar 1 segundo de vídeo, é necessário renderizar cerca de 30 imagens. Devido a resultados de geração pouco satisfatórios, muitos dos vídeos gerados acabam por ser descartados; a taxa final de aproveitamento é apenas de 5%-10%. Em outras palavras, por cada vídeo “em condições”, dezenas de vezes de poder de computação são desperdiçadas. Isto faz com que surja o fenómeno de uma inversão grave entre receitas e custos, tornando cada vez mais difícil manter o modelo operacional.

** Iteração rápida de modelos grandes de vídeo a partir de texto na China**

** Custos mais baixos e ampla aplicabilidade **

O encerramento do Sora também levou muitas pessoas a levantar dúvidas: será que, em relação a modelos grandes do mesmo tipo, com funcionalidades semelhantes às do Sora e cujo foco é a geração de vídeo, na China, também enfrentam as mesmas dificuldades de sobrevivência? Insiders afirmam que, para os modelos grandes, “ser útil” — ou seja, ter cenários de aplicação ricos — é particularmente importante. Ao integrar-se profundamente no mercado, é isso que consegue trazer uma vitalidade mais duradoura.

Semelhante ao Sora, o Seedance2.0 também explodiu numa noite e dominou o feed de toda a internet. Comparado com o Sora, como já existe uma base industrial destes dois anos, os consumidores podem experimentar diretamente serviços de ponta a ponta, como geração de vídeo, edição e publicação em plataformas sociais. E, além disso, um outro modelo grande que mantém uma “vitalidade” estável há quase dois anos, o Ke Ke — Ke AI? — continua a ser atualizado continuamente com base no perfil dos utilizadores, com o número de iterações já a ultrapassar 30.

Shen Linlin, professora da Escola de Inteligência Artificial da Universidade de Shenzhen: a concorrência entre modelos grandes é também muito intensa. É necessário que as empresas continuem a iterar e a evoluir, aproximando-se melhor das necessidades do mercado e dos utilizadores, aumentando a eficiência de produção em vários domínios específicos e reduzindo os custos correspondentes.

E, ao calcular a partir do custo de utilização por parte dos utilizadores, verificamos que gerar um trecho ideal com cerca de 15 segundos no Sora exige tentar 5-10 vezes, o que equivale a cerca de 800 yuan renminbi. Já ao utilizar software de modelos grandes nacionais mais comuns para geração a partir de texto, mesmo ao tentar gerar 10 vezes um trecho de cerca de 15 segundos, o custo é apenas de cerca de 150 yuan.

Li Piji, professor da Escola de Inteligência Artificial da Universidade de Aviação e Astronáutica de Nanjing: as capacidades de computação, a electricidade e outros recursos, por si só, já têm vantagens únicas na China: custos mais baixos, computação mais rápida. Além disso, quando as empresas nacionais fazem upgrade e iteração dos modelos grandes, dão mais ênfase à capacidade de ser leve e à utilidade. Por isso, na concorrência do mercado, existe uma vantagem evidente.

Segundo estatísticas incompletas, actualmente já existem mais de 3000 pequenos estúdios a usar modelos grandes de vídeo a partir de texto como ferramenta central de criação. Alguns estúdios, com o apoio de modelos de vídeo gerados a partir de texto, conseguiram aumentar o número de vídeos produzidos por mês em mais de 3 vezes do que antes. Além disso, cada vez mais utilizadores a nível empresarial têm vindo a surgir, e a grande vantagem do mercado nacional nas áreas de dramas curtos e vídeos curtos começa a evidenciar-se. Recentemente, vários dramas curtos e filmes institucionais empresariais, realizados com modelos grandes a partir de texto, explodiram na internet.

Nos primeiros dois meses deste ano, o Gabinete Nacional de Informações da Internet (NCI) acrescentou 48 modelos grandes à lista de registo, abrangendo vários cenários de aplicação, como fabrico industrial, turismo cultural e saúde médica.

Shen Linlin, professora da Escola de Inteligência Artificial da Universidade de Shenzhen: em essência, os modelos grandes continuam a servir o mercado e as aplicações. Cada vez mais modelos grandes começam a enraizar-se em cenários de aplicação específicos e a alinhar-se com as necessidades dos utilizadores, passando do “show de técnicas” para a aplicação prática. E, ao mesmo tempo que se forma um ciclo fechado entre a indústria e os modelos grandes, também se acelera a sincronização da cadeia de inovação com a cadeia industrial, criando um grupo de utilizadores estável e modelos de negócio.

(Fonte: CCTV Finance)

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar