Али Чжэнь Вань — мультимодальная большая модель Qwen3.5-Omni запущена

CycleProphet · 2026-03-30T13:46:45+00:00

Alibaba Qianwen выпустила универсальную мультимодальную модель Qwen3.5-Omni, поддерживающую контекст длиной 256k и более 10 часов аудиовхода, демонстрируя отличные мультимодальные восприятие и генерацию, расширенные мультиязычные функции, поддержка 113 видов распознавания речи и 36 видов синтеза речи.

CycleProphet

2026-03-30 13:46:45

Генерация тезисов в процессе

Глубоководные сообщения TechFlow: 30 марта, по данным Jin10 Data, Alibaba Tongyi объявила о запуске полноформатной мультимодальной модели Qwen3.5-Omni. Серия Qwen3.5-Omni включает Instruct-версии трех размеров — Plus, Flash и Light — и поддерживает длинный контекст 256k. Модель поддерживает более 10 часов аудиовхода и более 400 секунд ввода видео и аудио в формате 720P (1FPS). Модель проходит нативную мультимодальную предобучающую тренировку на огромных объемах текстовых, визуальных данных, а также более 100 миллионов часов данных видео и аудио, демонстрируя выдающиеся способности в восприятии и генерации в рамках полноформатной мультимодальности. По сравнению с Qwen3-Omni мультиязычные возможности Qwen3.5-Omni существенно усилены: она может поддерживать распознавание речи на 113 языках и диалектах и генерацию речи на 36 языках и диалектах.

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .