Алі випустила нове покоління мультимодальної великої моделі Qwen3.5-Omni

robot
Генерація анотацій у процесі

30 березня Alibaba представила нове покоління мультимодальної моделі повного циклу Qwen3.5-Omni, «Цяньвень», що є повнодіючою мультимодальною великою мовною моделлю. У 215 завданнях, зокрема розумінні аудіо/відео, розпізнаванні та взаємодії, досягнуто SOTA (найкращої продуктивності), що перевершує Gemini-3.1 Pro, і модель стала однією з найпотужніших мультимодальних моделей у світі на сьогодні. Нова модель має надзвичайно сильні можливості розуміння аудіо/відео та миттєвої взаємодії. Вона може створювати детальні й керовані структуровані описи для контенту аудіо/відео, розпізнає мови та діалекти у кількості аж 113, а також приємно здивувала появою здатності до Vibe Coding для аудіо/відео.

Наразі Alibaba Cloud Bailian оновив API трьох типів — Plus, Flash і Light — для Qwen3.5-Omni. Їх можна широко застосовувати в індустрії коротких відео/стрімінг-платформ, ігор, роботи для медіа-авторів тощо. Звичайні користувачі також можуть перейти в Qwen Chat і безкоштовно протестувати. Розробники та компанії можуть викликати модель Qwen3.5-Omni через платформу Alibaba Cloud Bailian, причому введення за кожні 1 млн Tokens (токенів) коштує менше 0.8 юаня.

(Джерело: Дейлі економік ньюс)

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Популярні активності Gate Fun

    Дізнатися більше
  • Рин. кап.:$2.27KХолдери:2
    0.00%
  • Рин. кап.:$2.37KХолдери:2
    1.04%
  • Рин. кап.:$2.24KХолдери:1
    0.00%
  • Рин. кап.:$2.24KХолдери:1
    0.00%
  • Рин. кап.:$2.25KХолдери:1
    0.00%
  • Закріпити