Google лише тихо став єдиною компанією, яка може генерувати текст, зображення, відео та музику всередині однієї програми.


lyria 3 вийшла сьогодні. ось чому це важливіше, ніж здається.
Мультиформатна таблиця лідерів зараз:
Google Gemini: текст ✅ зображення ✅ відео ✅ музика ✅
OpenAI: текст ✅ зображення ✅ відео ✅ музика ❌ (наступає)
Meta: текст ✅ зображення ✅ відео ✅ музика ❌
Anthropic: текст ✅ зображення ❌ відео ❌ музика ❌
Google просто першим виконав усі пункти.
lyria 3 робить текст до треків, зображення до треків і відео до треків. 30-секундні пісні з користувацькими текстами. Ви завантажуєте фото вашого собаки, і він пише пісню про вашого собаку.
дурно? можливо. але саме так починається прийняття.
стартапи, що спеціалізуються на музичному AI, мають звернути увагу.
suno має $200М/рік доходу. залучено $2.45МБ. 100М користувачів за 2 роки. udio уклала угоду з Universal і Warner. elevenlabs запустила генерацію музики і досягла $200M ARR.
але Google просто зробила генерацію музики безкоштовною всередині програми, яку вже використовують мільярди людей.
Це стратегія об’єднання, яка вбиває стартапи.
Пам’ятаєте, коли окремі додатки для генерації зображень боялися, що DALL-E буде інтегровано у ChatGPT? той самий сценарій. функція завжди перемагає продукт, коли розповсюдження у 1000 разів більше.
сьогодні lyra 3 — це іграшка на 30 секунд. suno дає вам стеми, інпейнтінг, треки по 15 хвилин, вокальні персонажі. наразі немає конкуренції за якістю.
але suno мала ту саму перевагу над першою моделлю музики Google. потім v2. потім v3. розрив зменшується з кожною версією.
OpenAI також створює свою. співпрацює з студентами Juilliard для анотації навчальних даних. нова аудіо-модель, ймовірно, з’явиться до березня.
але "очікувано" і "відправлено" — це різні слова. Google відправила сьогодні.
Їхній план такий самий, як у Google. об’єднати все в один діалог.
"Зроби мені відео про X. тепер додай музику. тепер напиши підпис."
це продукт. не генератор музики. генератор усього.
Тимчасова шкала модальностей розповідає всю історію:
2022: генерація тексту (усі напружуються)
2023: генерація зображень (midjourney вибухає)
2024: генерація відео (sora, runway, kling)
2025: генерація музики (suno досягає $200М)
2026: все це. в одній програмі. з одного запиту.
Гонка не про те, хто має найкращий музичний AI або найкращий AI для зображень або відео.
Вона про те, хто першим з’єднає їх усіх у спосіб, що здається беззусильним.
Google щойно випередила.
Що я дивитимусь далі:
Чи випустить OpenAI музику до Q2?
Залишиться чи дохід Suno стабільним, коли Google зробить генерацію музики безкоштовною?
Як швидко "іграшка на 30 секунд" стане "інструментом для створення 3-хвилинних відео"?
Мультиформатна гонка отримала нову фінішну лінію.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити