Googleは静かに、1つのアプリ内でテキスト、画像、動画、そして音楽を生成できる唯一の企業になった。
lyria 3が本日リリースされた。これが人々が思うよりも重要な理由だ。
現在のマルチモーダルスコアボード:
Google Gemini:テキスト ✅ 画像 ✅ 動画 ✅ 音楽 ✅
OpenAI:テキスト ✅ 画像 ✅ 動画 ✅ 音楽 ❌ (近日登場)
Meta:テキスト ✅ 画像 ✅ 動画 ✅ 音楽 ❌
Anthropic:テキスト ✅ 画像 ❌ 動画 ❌ 音楽 ❌
Googleはまずすべてのボックスをチェックした。
lyria 3はテキストからトラックへ、画像からトラックへ、動画からトラックへと変換する。30秒の曲にカスタム歌詞を付けることも可能。あなたの犬の写真をアップロードすれば、その犬についての歌を書いてくれる。
馬鹿げてる?もしかしたら。でも、それが採用の始まりだ。
専用の音楽AIスタートアップは注目すべきだ。
sunoは年間2億ドルの収益を上げている。資金調達額は24億5000万ドル。2年で1億人のユーザー。udioはユニバーサルとワーナーと和解。elevenlabsは音楽生成を開始し、$200M ARR(を達成。
しかしGoogleはすでに多くの人が使うアプリ内で音楽生成を無料にした。
これはスタートアップを殺すバンドル戦略だ。
スタンドアロンの画像生成アプリがD
原文表示