Alibaba Cloud запустила модель Qwen3-Max з трильйоном параметрів, її продуктивність увійшла до числа кращих у світі.

robot
Генерація анотацій у процесі

【链文】24 вересня повідомляється, що Alibaba Cloud випустила найбільшу модель Qwen3-Max з моменту свого існування, кількість параметрів перевищує 1 трильйон, а для попереднього навчання використано 36 трильйонів токенів. Попередня версія Qwen3-Max-Instruct займає третє місце у світовому текстовому рейтингу LMArena, а фінальна версія показала покращення в генерації коду та завданнях для агентів, отримавши 69.6 балів у SWE-Bench Verified та 74.8 балів у Tau2-Bench. Версія Qwen3-Max-Thinking з посиленими можливостями інференції отримала максимальний бал у тестах з математичного мислення AIME 25 та HMMT. API вже відкрито, сумісно з викликами OpenAI.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 8
  • Репост
  • Поділіться
Прокоментувати
0/400
FunGibleTomvip
· 23год тому
Хоча шість дев'ять, але чи зможе він перевершити hf?
Переглянути оригіналвідповісти на0
NightAirdroppervip
· 23год тому
Схоже, все в порядку. Виправлено помилки з попередньої версії?
Переглянути оригіналвідповісти на0
  • Закріпити