2026-02-18 20:08:20

google baru saja diam-diam menjadi satu-satunya perusahaan yang dapat menghasilkan teks, gambar, video, DAN musik dalam satu aplikasi.

lyria 3 dirilis hari ini. inilah mengapa itu lebih penting daripada yang orang pikirkan.
skor papan multimodal saat ini:
Google Gemini: teks ✅ gambar ✅ video ✅ musik ✅
OpenAI: teks ✅ gambar ✅ video ✅ musik ❌ (akan datang)
Meta: teks ✅ gambar ✅ video ✅ musik ❌
Anthropic: teks ✅ gambar ❌ video ❌ musik ❌
google baru saja mengisi semua kotak terlebih dahulu.
lyria 3 melakukan teks ke lagu, gambar ke lagu, dan video ke lagu. lagu 30 detik dengan lirik kustom. kamu unggah foto anjingmu dan itu menulis lagu tentang anjingmu.
bodoh? mungkin. tapi begitulah awal adopsi.
startup AI musik khusus harus memperhatikan.
suno menghasilkan pendapatan $200J/tahun. dana dihimpun di $2.45Miliar. 100J pengguna dalam 2 tahun. udio menyelesaikan kesepakatan dengan universal dan warner. elevenlabs meluncurkan gen musik dan mencapai $200M ARR.
tapi google baru saja menjadikan gen musik gratis dalam aplikasi yang sudah digunakan oleh miliaran orang.
ini adalah strategi bundling yang membunuh startup.
ingat saat aplikasi gen gambar mandiri takut dall-e diintegrasikan ke chatgpt? sama saja. fitur selalu mengalahkan produk ketika distribusinya 1000x lebih besar.
hari ini lyria 3 hanyalah mainan selama 30 detik. suno memberi kamu stems, inpainting, lagu 15 menit, persona vokal. saat ini tidak ada yang sebanding dari segi kualitas.
tapi suno memiliki keunggulan yang sama atas model musik pertama google. lalu v2. lalu v3. jaraknya semakin dekat di setiap versi.
openai juga sedang membangun satu. bermitra dengan mahasiswa Juilliard untuk menandai data pelatihan. model audio baru dilaporkan akan hadir pada bulan Maret.
tapi "diperkirakan" dan "dikirim" adalah kata yang berbeda. google sudah mengirim hari ini.
strategi mereka sama seperti google. menggabungkan semuanya dalam satu percakapan.
"buatkan saya video tentang X. sekarang tambahkan musik. sekarang tulis caption-nya."
itulah produk. bukan generator musik. generator segala.
garis waktu modality menceritakan seluruh cerita:
2022: generasi teks (semua orang panik)
2023: generasi gambar (midjourney meledak)
2024: generasi video (sora, runway, kling)
2025: generasi musik (suno mencapai $200M)
2026: semuanya. dalam satu aplikasi. dari satu prompt.
perlombaan ini bukan tentang siapa yang punya AI musik terbaik. atau AI gambar terbaik. atau AI video terbaik.
ini tentang siapa yang pertama menggabungkan semuanya dengan cara yang terasa effortless.
google baru saja mengambil alih.
apa yang akan saya pantau berikutnya:
apakah openai akan merilis musik sebelum Q2?
apakah pendapatan suno tetap stabil saat google menggabungkan gen musik secara gratis?
seberapa cepat "mainan 30 detik" berubah menjadi "alat produksi 3 menit"?
perlombaan multimodal ini baru saja mendapatkan garis finish yang baru.

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

2 Suka