Google est maintenant la seule entreprise capable de générer du texte, des images, des vidéos ET de la musique dans une seule application, discrètement.
Lyria 3 est sortie aujourd'hui. Voici pourquoi cela compte plus que ce que l'on pense. Le tableau de bord multimodal en ce moment : Google Gemini : texte ✅ images ✅ vidéo ✅ musique ✅ OpenAI : texte ✅ images ✅ vidéo ✅ musique ❌ (à venir) Meta : texte ✅ images ✅ vidéo ✅ musique ❌ Anthropic : texte ✅ images ❌ vidéo ❌ musique ❌ Google a simplement coché toutes les cases en premier. Lyria 3 fait du texte en pistes, de l'image en pistes, et de la vidéo en pistes. Des chansons de 30 secondes avec des paroles personnalisées. Vous téléchargez une photo de votre chien et il écrit une chanson sur votre chien. Bête ? Peut-être. Mais c'est ainsi que l'adoption commence. Les startups d'IA musicale dédiées devraient faire attention. Suno génère 200 millions de dollars de revenus par an. Levée à 2,45 milliards de dollars. 100 millions d'utilisateurs en 2 ans. Udio a conclu un accord avec Universal et Warner. ElevenLabs a lancé la génération musicale et atteint $200M ARR. Mais Google vient de rendre la génération musicale gratuite dans une application que des milliards de personnes utilisent déjà. C'est la stratégie de bundling qui tue les startups. Vous vous souvenez quand les applications de génération d'images autonomes craignaient que DALL-E ne soit intégré à ChatGPT ? Même scénario. La fonctionnalité dépasse toujours le produit lorsque la distribution est 1000 fois plus grande. Aujourd'hui, Lyria 3 est un jouet de 30 secondes. Suno vous donne des stems, de l'inpainting, des pistes de 15 minutes, des personas vocaux. Pas de comparaison en termes de qualité pour l'instant. Mais Suno avait le même avantage sur le premier modèle musical de Google. Puis la V2. Ensuite la V3. L'écart se réduit à chaque version. OpenAI en construit aussi un. Partenariat avec des étudiants de Juilliard pour annoter les données d'entraînement. Un nouveau modèle audio serait prévu d'ici mars. Mais "attendu" et "expédié" sont deux mots différents. Google a livré aujourd'hui. Leur stratégie est la même que celle de Google. Tout regrouper en une seule conversation. "Fais-moi une vidéo sur X. Ajoute de la musique. Écris la légende." C'est le produit. Pas un générateur de musique. Un générateur de tout. La chronologie des modalités raconte toute l'histoire : 2022 : génération de texte ( tout le monde s'affole) 2023 : génération d'images ( Midjourney explose) 2024 : génération de vidéos ( Sora, Runway, Kling) 2025 : génération de musique ( Suno atteint 200 millions de dollars) 2026 : tout cela. dans une seule application. à partir d'une seule invite. La course ne concerne pas qui a la meilleure IA musicale. ou la meilleure IA d'images. ou la meilleure IA vidéo. Il s'agit de qui les rassemble tous en premier d'une manière qui semble sans effort. Google vient de prendre la tête. Ce que je vais surveiller ensuite : OpenAI livre-t-il la musique avant le Q2 ? Les revenus de Suno tiennent-ils lorsque Google bundle la génération musicale gratuitement ? À quelle vitesse le "jouet de 30 secondes" devient-il "outil de production de 3 minutes" ? La course multimodale vient de trouver une nouvelle ligne d'arrivée.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Google est maintenant la seule entreprise capable de générer du texte, des images, des vidéos ET de la musique dans une seule application, discrètement.
Lyria 3 est sortie aujourd'hui. Voici pourquoi cela compte plus que ce que l'on pense.
Le tableau de bord multimodal en ce moment :
Google Gemini : texte ✅ images ✅ vidéo ✅ musique ✅
OpenAI : texte ✅ images ✅ vidéo ✅ musique ❌ (à venir)
Meta : texte ✅ images ✅ vidéo ✅ musique ❌
Anthropic : texte ✅ images ❌ vidéo ❌ musique ❌
Google a simplement coché toutes les cases en premier.
Lyria 3 fait du texte en pistes, de l'image en pistes, et de la vidéo en pistes. Des chansons de 30 secondes avec des paroles personnalisées. Vous téléchargez une photo de votre chien et il écrit une chanson sur votre chien.
Bête ? Peut-être. Mais c'est ainsi que l'adoption commence.
Les startups d'IA musicale dédiées devraient faire attention.
Suno génère 200 millions de dollars de revenus par an. Levée à 2,45 milliards de dollars. 100 millions d'utilisateurs en 2 ans. Udio a conclu un accord avec Universal et Warner. ElevenLabs a lancé la génération musicale et atteint $200M ARR.
Mais Google vient de rendre la génération musicale gratuite dans une application que des milliards de personnes utilisent déjà.
C'est la stratégie de bundling qui tue les startups.
Vous vous souvenez quand les applications de génération d'images autonomes craignaient que DALL-E ne soit intégré à ChatGPT ? Même scénario. La fonctionnalité dépasse toujours le produit lorsque la distribution est 1000 fois plus grande.
Aujourd'hui, Lyria 3 est un jouet de 30 secondes. Suno vous donne des stems, de l'inpainting, des pistes de 15 minutes, des personas vocaux. Pas de comparaison en termes de qualité pour l'instant.
Mais Suno avait le même avantage sur le premier modèle musical de Google. Puis la V2. Ensuite la V3. L'écart se réduit à chaque version.
OpenAI en construit aussi un. Partenariat avec des étudiants de Juilliard pour annoter les données d'entraînement. Un nouveau modèle audio serait prévu d'ici mars.
Mais "attendu" et "expédié" sont deux mots différents. Google a livré aujourd'hui.
Leur stratégie est la même que celle de Google. Tout regrouper en une seule conversation.
"Fais-moi une vidéo sur X. Ajoute de la musique. Écris la légende."
C'est le produit. Pas un générateur de musique. Un générateur de tout.
La chronologie des modalités raconte toute l'histoire :
2022 : génération de texte ( tout le monde s'affole)
2023 : génération d'images ( Midjourney explose)
2024 : génération de vidéos ( Sora, Runway, Kling)
2025 : génération de musique ( Suno atteint 200 millions de dollars)
2026 : tout cela. dans une seule application. à partir d'une seule invite.
La course ne concerne pas qui a la meilleure IA musicale. ou la meilleure IA d'images. ou la meilleure IA vidéo.
Il s'agit de qui les rassemble tous en premier d'une manière qui semble sans effort.
Google vient de prendre la tête.
Ce que je vais surveiller ensuite :
OpenAI livre-t-il la musique avant le Q2 ?
Les revenus de Suno tiennent-ils lorsque Google bundle la génération musicale gratuitement ?
À quelle vitesse le "jouet de 30 secondes" devient-il "outil de production de 3 minutes" ?
La course multimodale vient de trouver une nouvelle ligne d'arrivée.