Алі випустила нове покоління базової моделі QianWen 3.5, піднявшись на вершину світового рейтингу найпотужніших відкритих великих моделей

robot
Генерація анотацій у процесі

16 лютого, у день китайського Нового року, Alibaba відкрила вихідний код новітньої генерації великої моделі Qwen3.5-Plus, яка за продуктивністю конкурує з Gemini 3 Pro і посідає перше місце у світі серед відкритих моделей.

За інформацією, Qwen3.5 здійснив повну революцію у базовій архітектурі моделі. Версія Qwen3.5-Plus, яка була випущена, має загалом 3970 мільярдів параметрів, активовано лише 170 мільярдів, продуктивність перевищує модель Qwen3-Max з понад трильйоном параметрів, при цьому споживання відеопам’яті при розгортанні знизилося на 60%, а швидкість обчислень значно зросла — максимальна пропускна здатність для обчислень може бути збільшена до 19 разів. Ціна API для Qwen3.5-Plus становить всього 0,8 юаня за мільйон токенів, що в 18 разів дешевше за Gemini 3 Pro.

На відміну від попередніх поколінь великих мовних моделей Qwen, Qwen3.5 здійснив перехід від чисто текстової моделі до нативної мультимодальної моделі. Qwen3 був попередньо натренований на чистих текстових токенах, тоді як Qwen3.5 базується на попередньому навчанні з використанням візуальних і текстових змішаних токенів, а також значно додано даних китайською, англійською, багатомовними, STEM та логікою. Це дозволило великій моделі з «розкритими очима» засвоїти більш глибокі знання про світ і логіку міркувань, досягти високої продуктивності з меншою кількістю параметрів — менше ніж 40% від параметрів базової моделі Qwen3-Max, — і показати відмінні результати у всіх основних бенчмарках, таких як міркування, програмування та агентські системи.

15 січня додаток Qwen був випущений як перший у світі споживчий AI-агент для покупок. під час святкового періоду цей агент допоміг користувачам виконати 120 мільйонів замовлень за 6 днів, що стало першим у світі масштабним виконанням реальних завдань і комерційною перевіркою. Завдяки значному покращенню можливостей агентів, Qwen3.5 відкриє нові горизонти для застосування додатку Qwen у роботі та житті.

З моменту відкриття коду у 2023 році Alibaba випустила понад 400 моделей Qwen, що охоплюють усі розміри та модальності. Загальна кількість завантажень Qwen у світі перевищила 1 мільярд, а місячний обсяг завантажень у 2-8 разів перевищує суму завантажень DeepSeek, Meta, OpenAI, Zhitu, Kimi, MiniMax та інших. Похідні моделі, створені розробниками на базі Qwen, налічують понад 200 000, що робить її найпопулярнішою відкритою моделлю у світі та найзручнішою для розробників. Враховуючи потреби AI-розробників і компаній у різних країнах, модель Qwen постійно удосконалюється: Qwen3.5 підтримує 201 мову, розмір словника збільшено з 150 000 до 250 000, що дозволяє підвищити ефективність кодування для малих мов до 60%.

Зазначається, що додаток Qwen та ПК-версія вже одразу інтегрували модель Qwen3.5-Plus. Розробники можуть завантажити нову модель у спільноті Moda або на HuggingFace, або отримати API через Alibaba Cloud Bailing. Незабаром Alibaba продовжить відкривати моделі серії Qwen3.5 різних розмірів і функцій. Також незабаром буде випущена флагманська модель Qwen3.5-Max з ще більш високою продуктивністю.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити