Вирусное видео и крупная модель внезапно закрыты! Взлёты и падения — в чем причина?

robot
Генерация тезисов в процессе

В последнее время OpenAI объявила о прекращении самостоятельного приложения Sora, API-интерфейса и встроенной видеофункции в ChatGPT, полностью выйдя с потребительского рынка генерации видео с помощью ИИ. (Новостная ссылка: Sora будет закрыта) Аналитики указывают, что главными причинами преждевременного завершения Sora всего через полгода после запуска стали недостаток жестко закрепленных потребностей и выручка, не оправдавшая ожиданий. Каким образом индустрия ИИ-видео может сохранить долгую жизнеспособность — вот в центре внимания многих.

Проанализировав количество скачиваний Sora, мы обнаружили, что в сентябре 2025 года, спустя 5 дней после официального запуска, число загрузок превысило 1 миллион, быстро поднявшись на первое место в бесплатном чарте магазинов приложений, а всплеск популярности также в какой-то момент превысил популярность ChatGPT за тот же период. Однако этот ажиотаж не продлился долго: менее чем за 3 месяца количество загрузок сократилось на 32% по сравнению с предыдущим периодом; в январе этого года загрузки продолжили резкое падение на 45%. К февралю загрузки Sora опустились ниже 100-го места в общем рейтинге бесплатных приложений.

На социальных платформах мы увидели такой пост: «В первые две недели после запуска мы с семьей сделали с помощью Sora более 100 видео. Это пробудило в нас настоящую креативность и радость. Но спустя две недели мы больше ни разу не открывали это. Мы считаем, что в этом и состоит истинная неудача Sora».

Этот пост вызвал многочисленные отклики у пользователей, и многие отметили, что Sora больше похожа на «занимательную игрушку», и ей трудно стать инструментом, который действительно помогает решать повседневные практические задачи.

Профессор Института искусственного интеллекта Нанкинского университета аэрокосмической техники Ли Пицзи: когда новый крупномасштабный модельный продукт только что выходит, он привлекает большое число пользователей, чтобы попробовать «на вкус». Хотя эти функции богаты и интересны, поскольку они не встроены в повседневные рабочие процессы пользователей и не решают проблемы с высокой частотой в повседневной жизни, активность использования программного продукта резко падает, возникает эффект «вспышки на короткое время».

Эксперты рассказали корреспонденту: по мере устойчивого снижения активности программ пользователи также постепенно меньше сохраняют привязку к продукту и их жесткая потребность в нем будет уменьшаться. При этом высокие затраты, такие как аренда GPU, расходы на электроэнергию, расходы на инференс и т. п., не снижаются. Согласно расчетам аналитической организации, дневная средняя стоимость работы Sora достигает 15 миллионов долларов США, в год — около 5,4 миллиарда долларов США; чтобы сгенерировать 1 секунду видео, нужно отрендерить примерно 30 изображений. Из-за неудовлетворительного качества генерации большая часть сгенерированных видео оказывается выброшенной, а доля реально пригодного контента составляет лишь 5%-10%. Иначе говоря, при выпуске 1 приемлемого видео десятки раз вычислительных мощностей тратятся впустую. Это приводит к тому, что выручка и затраты сильно расходятся, и операционная модель постепенно становится трудно поддерживаемой.

Внутренние модели «текст-видео» быстро развиваются

Низкая стоимость и широкое применение

Закрытие Sora породило у многих вопрос: сталкиваются ли схожие по функциям с Sora отечественные однотипные крупномодельные продукты, где основной акцент сделан на генерацию видео, с такой же проблемой выживания? Представители отрасли отмечают, что для крупномасштабных моделей «практичность», то есть наличие богатых сценариев применения, особенно важна: чем глубже модель укореняется в рынке, тем более устойчивой оказывается ее жизнеспособность.

Как и Sora, Seedance2.0 тоже внезапно стала очень популярной, «взорвав» весь интернет и заполонив ленты. По сравнению с Sora, поскольку уже есть двухлетняя индустриальная база, потребители могут сразу воспользоваться услугами «всё в одном»: генерация видео, редактирование, публикация на платформах соцсетей. А еще одна модель, которая сохраняет стабильную «жизнеспособность» уже почти два года — KeNeng/Sunrable? 可灵 — она постоянно обновляется на основе портретов пользователей, и число итераций уже превышает 30.

Профессор Института искусственного интеллекта Университета Шэньчжэнь Линь Линьлинь: конкуренция среди крупномасштабных моделей крайне жесткая. Каждая компания должна постоянно проводить итерации и обновления, лучше соответствовать потребностям рынка и пользователей, повышать производительность в различных узких областях и снижать соответствующие издержки.

Если посчитать исходя из стоимости использования пользователями, можно обнаружить: чтобы сгенерировать отрезок «идеального» клипа длительностью около 15 секунд, Sora нужно сделать 5-10 попыток, что в пересчете на юани составляет примерно 800 юаней. А при использовании отечественного ведущего ПО для «текст-видео» даже если попытаться сгенерировать 10 раз клип длительностью около 15 секунд, стоимость составит всего около 150 юаней.

Профессор Института искусственного интеллекта Нанкинского университета аэрокосмической техники Ли Пицзи: у отечественной вычислительной мощности, электроэнергии и т. п. изначально есть уникальные преимущества — низкая стоимость и быстрые вычисления. Кроме того, когда отечественные компании проводят обновления и итерации крупномасштабных моделей, они уделяют больше внимания легковесности и практичности, поэтому в рыночной конкуренции у них есть очевидные преимущества.

Согласно неполной статистике, на данный момент более 3000 небольших студий используют модели «текст-видео» как основной инструмент для создания контента. Некоторые студии, благодаря моделям «текст-видео» для вспомогательного творчества, увеличили число выпускаемых видео в месяц более чем в 3 раза по сравнению с прежним. Кроме того, все больше корпоративных пользователей постепенно появляется на рынке, и огромные преимущества отечественного рынка коротких драм и коротких видео начинают проявляться. В последнее время в сети «взорвались» несколько коротких драм и корпоративных промо-роликов, созданных с помощью крупномасштабных моделей «текст-видео».

В первые два месяца этого года Государственное управление киберпространства КНР дополнительно зарегистрировало 48 крупномасштабных моделей, охватив множество сценариев применения, включая промышленное производство, культурный туризм, здравоохранение и т. д.

Профессор Института искусственного интеллекта Университета Шэньчжэнь Линь Линьлинь: по своей сути крупномасштабные модели все еще служат рынку и приложениям. Всё больше крупномасштабных моделей начинает закрепляться в конкретных сценариях применения и лучше соответствовать потребностям пользователей, переходя от «показательной демонстрации навыков» к реальному применению. Одновременно с тем как индустрия и крупномасштабные модели формируют замкнутый цикл, ускоряется синхронное развитие инновационной цепочки и цепочки поставок, формируются стабильные группы пользователей и бизнес-модели.

(Источник: CCTV Finance and Economics)

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить