Qwen3.7-Max lançado oficialmente: 35 horas de escrita autônoma de código 1158 vezes, refinando operadores de aceleração 10x em chips nacionais.

robot
Geração do resumo em andamento
Notícias AIMPACT, 20 de maio (UTC+8), de acordo com o monitoramento do 动察 Beating, a Alibaba Tongyi Qianwen lançou oficialmente a nova base principal de agente inteligente Qwen3.7-Max.
Os dados reais divulgados oficialmente mostram que, sem qualquer documentação de arquitetura de chip e dados de análise de desempenho, o novo modelo, em uma tarefa de otimização de kernel totalmente autônoma com duração de 35 horas e abrangendo 1158 chamadas de ferramentas, melhorou à força o desempenho do operador Triton do processador chinês Pingtouge Zhenwu M890 em 10.0 vezes.
Durante o processo de otimização, o modelo passou por cinco estágios principais de evolução. Primeiramente, através da partição Split-K, o prefixo KV-cache foi dividido ao longo da dimensão token para preencher os 36 núcleos SM; em seguida, o cudaMalloc síncrono entre host e dispositivo foi substituído por variáveis PyTorch pré-alocadas, e usando metadados tensor, a ação síncrona cudaMemcpy ao consultar o comprimento do prefixo foi completamente eliminada, removendo totalmente a sobrecarga de comunicação entre host e dispositivo; no estágio final, o modelo reestruturou o operador para processar simultaneamente todos os 4 tokens de consulta em um único bloco de thread, compartilhando carga para distribuir a sobrecarga de acesso à memória, completando uma reestruturação arquitetônica especializada crucial.
Testes reais de otimização do operador mostram que o Qwen3.7-Max obteve uma aceleração geométrica média de 10.0x, superando significativamente o GLM 5.1 (7.3x) e o Kimi K2.6 (5.0x). Já o DeepSeek V4 Pro foi de apenas 3.3x e, na segunda metade, encerrou a tarefa prematuramente por não ter emitido nenhuma chamada de ferramenta por cinco rodadas consecutivas.
Para dominar estratégias gerais de resolução de problemas em ambientes variáveis, o Qwen3.7-Max desacoplou tarefa, framework de execução e verificador durante o treinamento, e através de treinamento de aprendizado por reforço cross-framework, evitou overfitting de atalhos em benchmarks específicos.
Nos benchmarks gerais de agente MCP-Mark (60.8 pontos) e SpreadSheetBench (87.0 pontos), o Qwen3.7-Max demonstrou forte generalização, e seu desempenho geral já está próximo do Claude-4.6-Opus-Max.
(Fonte: BlockBeats)
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado