Qwen3.7-Max офіційно випущено: 35 годин самостійного написання коду 1158 разів, на вітчизняних чіпах отримано 10-кратне прискорення оператора.

robot
Генерація анотацій у процесі
Повідомлення AIMPACT, 20 травня (UTC+8), за даними моніторингу Dongcha Beating, Alibaba Tongyi Qianwen офіційно випустила нове покоління флагманської основи інтелектуальних агентів Qwen3.7-Max.
Офіційні практичні дані показують, що без будь-якої документації щодо архітектури чипу та даних аналізу продуктивності, нова модель у завданні повністю автономної оптимізації ядра тривалістю 35 годин із 1158 викликами інструментів підвищила продуктивність оператора Triton китайського процесора Pingtouge Zhenwu M890 у 10,0 разів.
Під час оптимізації модель пройшла п'ять ключових етапів еволюції. Спочатку вона розділила KV-кеш префікса вздовж виміру токенів за допомогою розділення Split-K, щоб заповнити 36 ядер SM; потім замінила синхронний cudaMalloc між хостом і пристроєм на попередньо виділену змінну PyTorch, а за допомогою метаданих tensor повністю усунула синхронну дію cudaMemcpy при запиті довжини префікса, повністю видаливши накладні витрати на зв'язок між хостом і пристроєм; на останньому етапі модель реконструювала оператор, щоб одночасно обробляти всі 4 токени запиту в одному блоку потоків, спільно завантажуючи для розподілу витрат на доступ до пам'яті, завершивши ключову архітектурно-специфічну реконструкцію.
Практичне вимірювання оптимізації оператора показало, що Qwen3.7-Max досягла середнього геометричного прискорення в 10,0 разів, значно перевершивши GLM 5.1 (7,3x) та Kimi K2.6 (5,0x). Тоді як DeepSeek V4 Pro мала лише 3,3x і достроково завершила завдання на другій половині через те, що п'ять раундів поспіль не робила жодних викликів інструментів.
Щоб опанувати загальні стратегії вирішення завдань у мінливому середовищі, Qwen3.7-Max у навчанні розділила завдання, середовище виконання та валідатор, і завдяки навчанню з підкріпленням між середовищами уникнула переобучення на короткострокових шляхах для конкретних бенчмарків. На загальних бенчмарках агентів MCP-Mark (60,8 балів) та SpreadSheetBench (87,0 балів) Qwen3.7-Max продемонструвала надзвичайно сильне узагальнення, а загальна продуктивність наблизилася до Claude-4.6-Opus-Max.
(Джерело: BlockBeats)
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено