Alibaba Cloud запустила модель Qwen3-Max з трильйоном параметрів, її продуктивність увійшла до числа кращих у світі.

2025-09-24 02:56:20

Генерація анотацій у процесі

【链文】24 вересня повідомляється, що Alibaba Cloud випустила найбільшу модель Qwen3-Max з моменту свого існування, кількість параметрів перевищує 1 трильйон, а для попереднього навчання використано 36 трильйонів токенів. Попередня версія Qwen3-Max-Instruct займає третє місце у світовому текстовому рейтингу LMArena, а фінальна версія показала покращення в генерації коду та завданнях для агентів, отримавши 69.6 балів у SWE-Bench Verified та 74.8 балів у Tau2-Bench. Версія Qwen3-Max-Thinking з посиленими можливостями інференції отримала максимальний бал у тестах з математичного мислення AIME 25 та HMMT. API вже відкрито, сумісно з викликами OpenAI.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

17 лайків