Qwen3.7-Max oficialmente lanzado: 1158 veces de escritura de código autónomo en 35 horas, y ha perfeccionado un operador de aceleración 10 veces más rápido en chips nacionales

robot
Generación de resúmenes en curso
Según la monitorización de Beating, Alibaba Tongyi Qianwen ha lanzado oficialmente la nueva generación de base de agentes inteligentes, Qwen3.7-Max. Los datos de práctica publicados por la compañía muestran que, sin ningún documento de arquitectura de chip ni datos de análisis de rendimiento, el nuevo modelo logró mejorar en 10.0 veces el rendimiento del operador Triton en un tarea de optimización de núcleo completamente autónoma que duró 35 horas y realizó 1158 llamadas a herramientas.

Durante el proceso de optimización, el modelo pasó por cinco etapas clave de evolución. Primero, dividió el caché KV de prefijo mediante partición Split-K para llenar los 36 núcleos SM; luego, reemplazó la asignación cudaMalloc sincronizada entre la CPU y la GPU por variables preasignadas en PyTorch, y mediante el uso de metadatos de tensor eliminó completamente la acción de cudaMemcpy sincronizada al consultar la longitud del prefijo, eliminando por completo los costos de comunicación entre CPU y GPU; en la última etapa, el modelo reconstruyó los operadores para procesar simultáneamente los 4 tokens de consulta en un solo bloque de hilos, compartiendo la carga de acceso a memoria para distribuir los costos de acceso, logrando una reestructuración especializada a nivel arquitectónico.

Las pruebas de optimización de operadores mostraron que Qwen3.7-Max logró una aceleración media geométrica de 10.0x, superando notablemente a GLM 5.1 (7.3x) y Kimi K2.6 (5.0x). Mientras tanto, DeepSeek V4 Pro solo alcanzó 3.3x y en la segunda mitad del proceso terminó de forma anticipada debido a que no realizó ninguna llamada a herramientas en cinco rondas consecutivas.

Para dominar estrategias de resolución en entornos variables, Qwen3.7-Max desacopló tareas, marcos de ejecución y validadores durante el entrenamiento, y mediante aprendizaje reforzado entre marcos evitó sobreajustes a ciertos benchmarks específicos. En los benchmarks universales de agentes inteligentes MCP-Mark (60.8 puntos) y SpreadSheetBench (87.0 puntos), Qwen3.7-Max mostró una fuerte capacidad de generalización, alcanzando un rendimiento global que casi iguala a Claude-4.6-Opus-Max.
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado