Qwen3.7-Max é oficialmente lançado: em 35 horas escreveu código autonomamente 1158 vezes, e em chips nacionais refinou operadores de aceleração 10x.

robot
Geração de resumo em curso
Mensagem AIMPACT, 20 de maio (UTC+8), de acordo com a monitorização da Beating, a Alibaba Tongyi Qianwen lançou oficialmente a nova base de agentes flagship Qwen3.7-Max. Os dados práticos divulgados oficialmente mostram que, sem qualquer documentação de arquitetura de chip e dados de análise de desempenho, o novo modelo, numa tarefa de otimização autónoma do kernel que durou 35 horas e envolveu 1158 chamadas de ferramentas, aumentou à força o desempenho do operador Triton do processador chinês Pingtouge Zhenwu M890 em 10.0 vezes. Durante o processo de otimização, o modelo passou por cinco fases principais de evolução. Primeiro, através da partição Split-K, dividiu a cache KV de prefixo ao longo da dimensão token para preencher 36 núcleos SM; depois, substituiu o cudaMalloc síncrono entre o host e o dispositivo por variáveis PyTorch pré-alocadas e, usando metadados tensor, eliminou completamente a operação síncrona cudaMemcpy ao consultar o comprimento do prefixo, removendo totalmente a sobrecarga de comunicação entre o host e o dispositivo; na fase final, o modelo reestruturou o operador para processar simultaneamente todos os 4 tokens de consulta num único bloco de thread, partilhando carregamentos para distribuir a sobrecarga de acesso à memória, completando uma reestruturação crucial de especialização a nível de arquitetura. As medições reais de otimização do operador mostram que o Qwen3.7-Max obteve um rácio de aceleração média geométrica de 10.0x, superando significativamente o GLM 5.1 (7.3x) e o Kimi K2.6 (5.0x). Já o DeepSeek V4 Pro foi apenas de 3.3x e, na segunda metade, encerrou a tarefa prematuramente por não ter emitido qualquer chamada de ferramenta durante cinco rondas consecutivas. Para dominar estratégias genéricas de resolução de problemas em ambientes variáveis, o Qwen3.7-Max desacoplou a tarefa, o quadro de execução e o validador durante o treino e, através de treino de aprendizagem por reforço entre quadros, evitou o sobreajuste de atalhos específicos de referências. Nos benchmarks genéricos de agente MCP-Mark (60.8 pontos) e SpreadSheetBench (87.0 pontos), o Qwen3.7-Max demonstrou uma generalização extremamente forte, com desempenho global a aproximar-se do Claude-4.6-Opus-Max. (Fonte: BlockBeats)
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado