【链文】24 вересня повідомляється, що Alibaba Cloud випустила найбільшу модель Qwen3-Max з моменту свого існування, кількість параметрів перевищує 1 трильйон, а для попереднього навчання використано 36 трильйонів токенів. Попередня версія Qwen3-Max-Instruct займає третє місце у світовому текстовому рейтингу LMArena, а фінальна версія показала покращення в генерації коду та завданнях для агентів, отримавши 69.6 балів у SWE-Bench Verified та 74.8 балів у Tau2-Bench. Версія Qwen3-Max-Thinking з посиленими можливостями інференції отримала максимальний бал у тестах з математичного мислення AIME 25 та HMMT. API вже відкрито, сумісно з викликами OpenAI.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
17 лайків
Нагородити
17
8
Репост
Поділіться
Прокоментувати
0/400
FunGibleTom
· 23год тому
Хоча шість дев'ять, але чи зможе він перевершити hf?
Переглянути оригіналвідповісти на0
NightAirdropper
· 23год тому
Схоже, все в порядку. Виправлено помилки з попередньої версії?
Alibaba Cloud запустила модель Qwen3-Max з трильйоном параметрів, її продуктивність увійшла до числа кращих у світі.
【链文】24 вересня повідомляється, що Alibaba Cloud випустила найбільшу модель Qwen3-Max з моменту свого існування, кількість параметрів перевищує 1 трильйон, а для попереднього навчання використано 36 трильйонів токенів. Попередня версія Qwen3-Max-Instruct займає третє місце у світовому текстовому рейтингу LMArena, а фінальна версія показала покращення в генерації коду та завданнях для агентів, отримавши 69.6 балів у SWE-Bench Verified та 74.8 балів у Tau2-Bench. Версія Qwen3-Max-Thinking з посиленими можливостями інференції отримала максимальний бал у тестах з математичного мислення AIME 25 та HMMT. API вже відкрито, сумісно з викликами OpenAI.