Алі відкриває три середні моделі Qian 3.5 з відкритим кодом, які можна безпосередньо розгортати на споживчих відеокартах

robot
Генерація анотацій у процесі

Новини від Beijing News Shell Finance: (журналіст Ло Йідан) 25 лютого, після відкриття вихідного коду Qwen3.5-397B-A17B у новорічну ніч, Alibaba продовжує відкривати вихідний код серії моделей Qianwen 3.5. Цього разу відкрито три нові моделі середнього розміру: Qwen3.5-35B-A3B, Qwen3.5-122B-A10B, Qwen3.5-27B. Завдяки інноваціям у архітектурі та проривам у тренуванні, ці три моделі Qianwen 3.5 встановили нові рекорди для моделей середнього розміру, перевершуючи попередні флагманські моделі більшого розміру Qwen3-235B-A22B і Qwen3-VL, а також показуючи явну перевагу над GPT-5 mini у багатьох рейтингах.

Звертає на себе увагу, що нові моделі Qianwen 3.5 можна безпосередньо розгортати на споживчих відеокартах, що дуже зручно для розробників. Наразі модель Qwen3.5-Flash, заснована на Qwen3.5-35B-A3B, вже доступна на Alibaba Cloud Bailing, з ціною всього 0,2 юаня за мільйон токенів введення. Модель Qianwen 3.5 використовує гібридний механізм уваги, поєднуючи інновації у архітектурі MoE з високою розрідженістю, а також тренується на ще більшому обсязі текстових і візуальних змішаних токенів. Завдяки цьому нова модель досягає покращеної продуктивності при меншій кількості параметрів і активних параметрів.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити