Ф'ючерси
Сотні безстрокових контрактів
TradFi
Золото
Одна платформа для світових активів
Опціони
Hot
Торгівля ванільними опціонами європейського зразка
Єдиний рахунок
Максимізуйте ефективність вашого капіталу
Демо торгівля
Вступ до ф'ючерсної торгівлі
Підготуйтеся до ф’ючерсної торгівлі
Ф'ючерсні події
Заробляйте, беручи участь в подіях
Демо торгівля
Використовуйте віртуальні кошти для безризикової торгівлі
Запуск
CandyDrop
Збирайте цукерки, щоб заробити аірдропи
Launchpool
Швидкий стейкінг, заробляйте нові токени
HODLer Airdrop
Утримуйте GT і отримуйте масові аірдропи безкоштовно
Launchpad
Будьте першими в наступному великому проекту токенів
Alpha Поінти
Ончейн-торгівля та аірдропи
Ф'ючерсні бали
Заробляйте фʼючерсні бали та отримуйте аірдроп-винагороди
Інвестиції
Simple Earn
Заробляйте відсотки за допомогою неактивних токенів
Автоінвестування
Автоматичне інвестування на регулярній основі
Подвійні інвестиції
Прибуток від волатильності ринку
Soft Staking
Earn rewards with flexible staking
Криптопозика
0 Fees
Заставте одну криптовалюту, щоб позичити іншу
Центр кредитування
Єдиний центр кредитування
Центр багатства VIP
Преміальні плани зростання капіталу
Управління приватним капіталом
Розподіл преміальних активів
Квантовий фонд
Квантові стратегії найвищого рівня
Стейкінг
Стейкайте криптовалюту, щоб заробляти на продуктах PoS
Розумне кредитне плече
Кредитне плече без ліквідації
Випуск GUSD
Мінтинг GUSD для прибутку RWA
Mistral випустила Voxtral TTS, відкриту модель голосу з відкритою вагою, створену для використання на пристрої
Заголовок
Mistral випустила Voxtral TTS, модель голосу з відкритою вагою, призначену для використання на пристроях
Резюме
Mistral випустила Voxtral TTS, модель перетворення тексту в мову з 3 мільярдами параметрів з відкритими вагами. Модель розділена на три частини: мовна модель на 3.4B, яка обробляє текст, модель на 390M, яка генерує мовні особливості, та модель на 300M, яка виробляє фінальний аудіо. Після квантизації вона працює на ноутбуках з затримкою 90 мс, швидкістю 6x в реальному часі та 3 ГБ оперативної пам’яті.
Модель обробляє дев’ять мов і може клонувати голоси з лише 5 секунд аудіо — включаючи клонування голосу однією мовою та його розмову іншою. У внутрішніх тестах Mistral люди віддавали перевагу Voxtral 62.8% часу для стандартних голосів і 69.9% для індивідуальних. Випуск з відкритою вагою дозволяє компаніям запускати TTS на власному обладнанні, уникаючи витрат і проблем з конфіденційністю, пов’язаних з відправкою аудіо через зовнішні API.
Аналіз
Модульний дизайн відображає ширшу тенденцію до архітектур ШІ, оптимізованих для споживчого обладнання, а не для GPU в дата-центрах. Розділяючи розуміння тексту, генерацію мови та вихід аудіо на окремі компоненти, Mistral зробила систему більш гнучкою — компанії можуть потенційно замінювати або тонко налаштовувати окремі частини.
Це ставить Mistral в конкурентне становище з ElevenLabs на ринку, де більшість високоякісних TTS вимагає API-запитів до зовнішніх серверів. Для застосувань, таких як голосові асистенти або системи обслуговування клієнтів, обробка на пристрої усуває затримку і зберігає аудіодані локально. Це стає все більш важливим у міру посилення регуляцій щодо ШІ та конфіденційності даних.
Клонування голосів між мовами варте уваги. Якщо воно працює так, як заявлено, це може зробити виробництво багатомовного контенту набагато дешевшим. Але цифри переваг Mistral походять з внутрішнього тестування — незалежні бенчмарки покажуть, чи зберігається якість у реальних умовах у порівнянні з ElevenLabs та іншими конкурентами.
Оцінка впливу