Повідомлення AIMPACT, 20 травня (UTC+8), за даними моніторингу Dongcha Beating, Alibaba Tongyi Qianwen офіційно випустила нове покоління флагманської основи інтелектуальних агентів Qwen3.7-Max.
Офіційні практичні дані показують, що без будь-якої документації щодо архітектури чипу та даних аналізу продуктивності, нова модель у завданні повністю автономної оптимізації ядра тривалістю 35 годин із 1158 викликами інструментів підвищила продуктивність оператора Triton китайського процесора Pingtouge Zhenwu M890 у 10,0 разів.
Під час оптимізації модель пройшла п'ять ключових етапів еволюції. Спочатку вона розділила KV-кеш префікса вздовж виміру токенів за допомогою розділення Split-K, щоб заповнити 36 ядер SM; потім замінила синхронний cudaMalloc між хостом і пристроєм на попередньо виділену змінну PyTorch, а за допомогою метаданих tensor повністю усунула синхронну дію cudaMemcpy при запиті довжини префікса, повністю видаливши накладні витрати на зв'язок між хостом і пристроєм; на останньому етапі модель реконструювала оператор, щоб одночасно обробляти всі 4 токени запиту в одному блоку потоків, спільно завантажуючи для розподілу витрат на доступ до пам'яті, завершивши ключову архітектурно-специфічну реконструкцію.
Практичне вимірювання оптимізації оператора показало, що Qwen3.7-Max досягла середнього геометричного прискорення в 10,0 разів, значно перевершивши GLM 5.1 (7,3x) та Kimi K2.6 (5,0x). Тоді як DeepSeek V4 Pro мала лише 3,3x і достроково завершила завдання на другій половині через те, що п'ять раундів поспіль не робила жодних викликів інструментів.
Щоб опанувати загальні стратегії вирішення завдань у мінливому середовищі, Qwen3.7-Max у навчанні розділила завдання, середовище виконання та валідатор, і завдяки навчанню з підкріпленням між середовищами уникнула переобучення на короткострокових шляхах для конкретних бенчмарків. На загальних бенчмарках агентів MCP-Mark (60,8 балів) та SpreadSheetBench (87,0 балів) Qwen3.7-Max продемонструвала надзвичайно сильне узагальнення, а загальна продуктивність наблизилася до Claude-4.6-Opus-Max.
(Джерело: BlockBeats)

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

Нагородити
подобається
Прокоментувати
Репост
Поділіться

Прокоментувати

Додати коментар

Немає коментарів

Популярні теми
Дізнатися більше
#
SKHynixTopsKOSPIByMarketCap
1,47M Популярність
#
BTCProbes60KKeySupportLevel
329,04M Популярність
#
IsraelStrikesIranBTCPlunges
62,7K Популярність
#
WorldCup🏴󠁧󠁢󠁳󠁣󠁴󠁿vs🇧🇷
288,81K Популярність
#
TradFiCFDGoldMaster
2,18M Популярність

Закріплено

карта сайту

Qwen3.7-Max офіційно випущено: 35 годин самостійного написання коду 1158 разів, на вітчизняних чіпах отримано 10-кратне прискорення оператора.

Популярні теми

SKHynixTopsKOSPIByMarketCap

BTCProbes60KKeySupportLevel

IsraelStrikesIranBTCPlunges

WorldCup🏴󠁧󠁢󠁳󠁣󠁴󠁿vs🇧🇷

TradFiCFDGoldMaster

Закріплено