google vừa âm thầm trở thành công ty duy nhất có thể tạo ra văn bản, hình ảnh, video, VÀ âm nhạc trong cùng một ứng dụng.


lyria 3 ra mắt hôm nay. đây là lý do tại sao điều đó quan trọng hơn mọi người nghĩ.
bảng xếp hạng đa phương tiện hiện tại:
Google Gemini: văn bản ✅ hình ảnh ✅ video ✅ âm nhạc ✅
OpenAI: văn bản ✅ hình ảnh ✅ video ✅ âm nhạc ❌ (đang đến)
Meta: văn bản ✅ hình ảnh ✅ video ✅ âm nhạc ❌
Anthropic: văn bản ✅ hình ảnh ❌ video ❌ âm nhạc ❌
google vừa điền đầy đủ mọi ô trước.
lyria 3 có thể chuyển văn bản thành nhạc, hình ảnh thành nhạc, và video thành nhạc. bài hát 30 giây với lời tùy chỉnh. bạn tải lên một bức ảnh về chó của mình và nó viết một bài hát về chú chó đó.
ngớ ngẩn? có thể. nhưng đó là cách bắt đầu chấp nhận.
các startup AI âm nhạc chuyên dụng nên chú ý.
suno đạt doanh thu 200 triệu đô/năm. huy động vốn với giá trị 2.45 tỷ đô. 100 triệu người dùng trong 2 năm. udio đã hòa giải với universal và warner. elevenlabs ra mắt công nghệ tạo nhạc và đạt $200M ARR.
nhưng google vừa làm cho việc tạo nhạc miễn phí trong một ứng dụng mà hàng tỷ người đã sử dụng.
đây là chiến lược tích hợp tất cả để giết chết các startup.
nhớ khi các ứng dụng tạo hình ảnh độc lập lo sợ dall-e bị tích hợp vào chatgpt? cùng chiến lược đó. tính năng luôn vượt trội hơn sản phẩm khi phân phối lớn gấp 1000 lần.
hôm nay lyria 3 chỉ là một món đồ chơi 30 giây. suno cung cấp stems, inpainting, nhạc 15 phút, nhân vật giọng hát. hiện tại chưa có đối thủ về chất lượng.
nhưng suno từng có lợi thế tương tự so với mô hình âm nhạc đầu tiên của google. rồi v2. rồi v3. khoảng cách ngày càng thu hẹp qua từng phiên bản.
openai cũng đang xây dựng một mô hình như vậy. hợp tác với sinh viên Juilliard để chú thích dữ liệu huấn luyện. mô hình âm thanh mới dự kiến ra mắt vào tháng 3.
nhưng "dự kiến" và "đã phát hành" là hai từ khác nhau. google đã phát hành hôm nay.
chiến lược của họ giống như google. tích hợp mọi thứ vào một cuộc trò chuyện.
"hãy làm cho tôi một video về X. bây giờ thêm nhạc. bây giờ viết chú thích."
đó là sản phẩm. không chỉ là một trình tạo nhạc. là một trình tạo mọi thứ.
dòng thời gian đa phương tiện kể toàn bộ câu chuyện:
2022: tạo văn bản (mọi người rối loạn)
2023: tạo hình ảnh (midjourney bùng nổ)
2024: tạo video (sora, runway, kling)
2025: tạo nhạc (suno đạt 200 triệu đô)
2026: tất cả trong một ứng dụng. từ một lệnh duy nhất.
cuộc đua không phải là ai có AI âm nhạc tốt nhất. hoặc AI hình ảnh tốt nhất. hoặc AI video tốt nhất.
mà là ai đưa tất cả chúng vào cùng một hệ thống một cách dễ dàng nhất.
google vừa dẫn đầu.
những gì tôi sẽ theo dõi tiếp theo:
openai có phát hành nhạc trước quý 2 không?
doanh thu của suno có giữ vững khi google tích hợp tạo nhạc miễn phí không?
"30 giây đồ chơi" nhanh đến mức nào để trở thành "công cụ sản xuất 3 phút"?
cuộc đua đa phương tiện vừa có thêm một đích đến mới.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Gate Fun hot

    Xem thêm
  • Vốn hóa:$2.48KNgười nắm giữ:2
    0.09%
  • Vốn hóa:$2.43KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.45KNgười nắm giữ:2
    0.00%
  • Vốn hóa:$2.43KNgười nắm giữ:0
    0.00%
  • Vốn hóa:$2.43KNgười nắm giữ:1
    0.00%
  • Ghim