Cơ bản
Giao ngay
Giao dịch tiền điện tử một cách tự do
Giao dịch ký quỹ
Tăng lợi nhuận của bạn với đòn bẩy
Chuyển đổi và Đầu tư định kỳ
0 Fees
Giao dịch bất kể khối lượng không mất phí không trượt giá
ETF
Sản phẩm ETF có thuộc tính đòn bẩy giao dịch giao ngay không cần vay không cháy tải khoản
Giao dịch trước giờ mở cửa
Giao dịch token mới trước niêm yết
Futures
Truy cập hàng trăm hợp đồng vĩnh cửu
TradFi
Vàng
Một nền tảng cho tài sản truyền thống
Quyền chọn
Hot
Giao dịch với các quyền chọn kiểu Châu Âu
Tài khoản hợp nhất
Tối đa hóa hiệu quả sử dụng vốn của bạn
Giao dịch demo
Giới thiệu về Giao dịch hợp đồng tương lai
Nắm vững kỹ năng giao dịch hợp đồng từ đầu
Sự kiện tương lai
Tham gia sự kiện để nhận phần thưởng
Giao dịch demo
Sử dụng tiền ảo để trải nghiệm giao dịch không rủi ro
Launch
CandyDrop
Sưu tập kẹo để kiếm airdrop
Launchpool
Thế chấp nhanh, kiếm token mới tiềm năng
HODLer Airdrop
Nắm giữ GT và nhận được airdrop lớn miễn phí
Launchpad
Đăng ký sớm dự án token lớn tiếp theo
Điểm Alpha
Giao dịch trên chuỗi và nhận airdrop
Điểm Futures
Kiếm điểm futures và nhận phần thưởng airdrop
Đầu tư
Simple Earn
Kiếm lãi từ các token nhàn rỗi
Đầu tư tự động
Đầu tư tự động một cách thường xuyên.
Sản phẩm tiền kép
Kiếm lợi nhuận từ biến động thị trường
Soft Staking
Kiếm phần thưởng với staking linh hoạt
Vay Crypto
0 Fees
Thế chấp một loại tiền điện tử để vay một loại khác
Trung tâm cho vay
Trung tâm cho vay một cửa
Mistral Ra mắt Voxtral TTS, một Mô hình Giọng nói Mở Trọng lượng được xây dựng cho việc sử dụng trên thiết bị
Headline
Mistral phát hành Voxtral TTS, một mô hình giọng nói có trọng số mở được xây dựng cho việc sử dụng trên thiết bị
Summary
Mistral đã phát hành Voxtral TTS, một mô hình chuyển văn bản thành giọng nói với 3 tỷ tham số và trọng số mở. Mô hình này chia thành ba phần: một mô hình ngôn ngữ 3,4B xử lý văn bản, một mô hình 390M tạo ra các đặc điểm giọng nói, và một mô hình 300M sản xuất âm thanh cuối cùng. Sau khi lượng tử hóa, nó chạy trên máy tính xách tay với độ trễ 90ms, tốc độ 6x thời gian thực và 3GB RAM.
Mô hình này xử lý chín ngôn ngữ và có thể nhân bản giọng nói chỉ từ 5 giây âm thanh—bao gồm việc nhân bản một giọng nói trong một ngôn ngữ và khiến nó nói một ngôn ngữ khác. Trong các thử nghiệm nội bộ của Mistral, mọi người đã thích Voxtral hơn ElevenLabs 62,8% thời gian cho các giọng nói mặc định và 69,9% cho các giọng nói tùy chỉnh. Việc phát hành trọng số mở cho phép các công ty chạy TTS trên phần cứng của riêng họ, tránh chi phí và lo ngại về quyền riêng tư khi gửi âm thanh qua các API bên ngoài.
Analysis
Thiết kế mô-đun phản ánh một xu hướng rộng lớn hơn hướng tới các kiến trúc AI tối ưu hóa cho phần cứng tiêu dùng thay vì GPU trung tâm dữ liệu. Bằng cách tách biệt việc hiểu văn bản, tạo giọng nói và xuất âm thanh thành các thành phần riêng biệt, Mistral đã làm cho hệ thống linh hoạt hơn—các công ty có thể thay thế hoặc tinh chỉnh từng phần riêng lẻ.
Điều này định vị Mistral đối đầu với ElevenLabs trong một thị trường mà hầu hết các TTS chất lượng cao yêu cầu gọi API đến các máy chủ bên ngoài. Đối với các ứng dụng như trợ lý giọng nói hoặc hệ thống dịch vụ khách hàng, việc xử lý trên thiết bị loại bỏ độ trễ vòng đi vòng lại và giữ dữ liệu âm thanh tại chỗ. Điều này càng quan trọng hơn khi các quy định xung quanh AI và quyền riêng tư dữ liệu ngày càng thắt chặt.
Việc nhân bản giọng nói giữa các ngôn ngữ là điều đáng chú ý. Nếu nó hoạt động như đã quảng cáo, nó có thể làm cho việc sản xuất nội dung đa ngôn ngữ rẻ hơn rất nhiều. Nhưng các con số về sự ưa thích của Mistral đến từ các thử nghiệm nội bộ—các tiêu chuẩn độc lập sẽ cho thấy liệu chất lượng có giữ vững so với ElevenLabs và các đối thủ khác trong thực tế hay không.
Impact Assessment