Али Чжэнь Вань полностью мультимодальная большая модель Qwen3.5-Omni запущена

robot
Генерация тезисов в процессе

Сообщение BlockBeats, 30 марта, Alibaba Tongyi Qianwen объявила о запуске полноформатной (omni) модели Qwen3.5-Omni. Серия Qwen3.5-Omni включает Instruct-версии трех размеров — Plus, Flash и Light — и поддерживает контекст длиной 256k. Модель поддерживает аудиоввод более 10 часов и видеоввод 720P (1FPS) более 400 секунд. Модель проходит нативное мультимодальное предобучение на огромных массивах текстовых, визуальных и аудиовизуальных данных объемом более 100 млн часов, демонстрируя выдающиеся способности к восприятию и генерации в полном мультимодальном спектре. По сравнению с Qwen3-Omni, возможности Qwen3.5-Omni в многоязычности значительно усилены: она может выполнять распознавание речи на 113 языках и диалектах и генерацию речи на 36 языках и диалектах. (Jin10)

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить