Али Чжэнь Вань — мультимодальная большая модель Qwen3.5-Omni запущена

robot
Генерация тезисов в процессе

Глубоководные сообщения TechFlow: 30 марта, по данным Jin10 Data, Alibaba Tongyi объявила о запуске полноформатной мультимодальной модели Qwen3.5-Omni. Серия Qwen3.5-Omni включает Instruct-версии трех размеров — Plus, Flash и Light — и поддерживает длинный контекст 256k. Модель поддерживает более 10 часов аудиовхода и более 400 секунд ввода видео и аудио в формате 720P (1FPS). Модель проходит нативную мультимодальную предобучающую тренировку на огромных объемах текстовых, визуальных данных, а также более 100 миллионов часов данных видео и аудио, демонстрируя выдающиеся способности в восприятии и генерации в рамках полноформатной мультимодальности. По сравнению с Qwen3-Omni мультиязычные возможности Qwen3.5-Omni существенно усилены: она может поддерживать распознавание речи на 113 языках и диалектах и генерацию речи на 36 языках и диалектах.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить