Али Чжэнь Вань полностью мультимодальная большая модель Qwen3.5-Omni запущена

robot
Генерация тезисов в процессе

Народные финансовые новости, 30 марта. Alibaba Qianwen объявила о запуске полноформатной (full-modal) языковой модели Qwen3.5-Omni. Серия Qwen3.5-Omni включает Instruct-версии трех размеров — Plus, Flash и Light; поддерживает длинный контекст 256k; модель поддерживает ввод аудио более 10 часов и ввод аудиовизуальных данных 720P (1 FPS) более 400 секунд. Модель прошла нативное мультимодальное предобучение на огромных массивах текстовых, визуальных и аудиовизуальных данных объемом более 100 миллионов часов. Модель демонстрирует выдающиеся способности восприятия и генерации во всех модальностях. По сравнению с Qwen3-Omni, многоязычные возможности Qwen3.5-Omni значительно усилены: она может поддерживать распознавание речи на 113 языках и диалектах и речевую генерацию на 36 языках и диалектах.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить