Фьючерсы
Доступ к сотням фьючерсов
TradFi
Золото
Одна платформа мировых активов
Опционы
Hot
Торги опционами Vanilla в европейском стиле
Единый счет
Увеличьте эффективность вашего капитала
Демо-торговля
Введение в торговлю фьючерсами
Подготовьтесь к торговле фьючерсами
Фьючерсные события
Получайте награды в событиях
Демо-торговля
Используйте виртуальные средства для торговли без риска
Запуск
CandyDrop
Собирайте конфеты, чтобы заработать аирдропы
Launchpool
Быстрый стейкинг, заработайте потенциальные новые токены
HODLer Airdrop
Удерживайте GT и получайте огромные аирдропы бесплатно
Launchpad
Будьте готовы к следующему крупному токен-проекту
Alpha Points
Торгуйте и получайте аирдропы
Фьючерсные баллы
Зарабатывайте баллы и получайте награды аирдропа
Инвестиции
Simple Earn
Зарабатывайте проценты с помощью неиспользуемых токенов
Автоинвест.
Автоинвестиции на регулярной основе.
Бивалютные инвестиции
Доход от волатильности рынка
Мягкий стейкинг
Получайте вознаграждения с помощью гибкого стейкинга
Криптозаймы
0 Fees
Заложите одну криптовалюту, чтобы занять другую
Центр кредитования
Единый центр кредитования
Mistral выпускает Voxtral TTS — модель голоса с открытым весом, предназначенную для использования на устройстве
Заголовок
Mistral выпускает Voxtral TTS, открытая голосовая модель с весами, разработанная для использования на устройствах
Резюме
Mistral выпустил Voxtral TTS, модель преобразования текста в речь с 3 миллиардами параметров и открытыми весами. Модель делится на три части: языковая модель на 3,4 млрд, которая обрабатывает текст, модель на 390M, которая генерирует речевые признаки, и модель на 300M, которая производит финальный звук. После квантизации она работает на ноутбуках с задержкой 90 мс, в 6 раз быстрее реального времени и требует 3 ГБ ОЗУ.
Модель поддерживает девять языков и может клонировать голоса всего за 5 секунд аудио, включая клонирование голоса на одном языке и его озвучивание на другом. В внутренних тестах Mistral люди предпочитали Voxtral по сравнению с ElevenLabs 62,8% времени для стандартных голосов и 69,9% для пользовательских. Выпуск с открытыми весами позволяет компаниям запускать TTS на собственном оборудовании, избегая затрат и проблем с конфиденциальностью, связанных с передачей аудио через внешние API.
Анализ
Модульный дизайн отражает более широкую тенденцию к архитектурам ИИ, оптимизированным для потребительского оборудования, а не для серверов в центрах обработки данных. Разделив понимание текста, генерацию речи и аудиовыход на отдельные компоненты, Mistral сделал систему более гибкой — компании могут потенциально заменять или настраивать отдельные элементы.
Это ставит Mistral в противостояние с ElevenLabs на рынке, где большинство высококачественного TTS требует вызовов API к внешним серверам. Для таких приложений, как голосовые помощники или системы обслуживания клиентов, обработка на устройстве устраняет задержку и сохраняет аудиоданные локально. Это становится более важным по мере ужесточения регулирования в области ИИ и конфиденциальности данных.
Клонирование голосов между языками стоит внимательно рассмотреть. Если оно будет работать, как рекламируется, это может сделать производство многоязычного контента значительно дешевле. Но цифры предпочтений Mistral основаны на внутренних тестах — независимые проверки покажут, сохраняется ли качество по сравнению с ElevenLabs и другими конкурентами в реальных условиях.
Оценка воздействия