Qwen3.7-Max lanzado oficialmente: 35 horas de escritura autónoma de código 1158 veces, forjando operadores de aceleración 10x en chips domésticos.

robot
Generación de resúmenes en curso
AIMPACT noticias, 20 de mayo (UTC+8), según el monitoreo de Dongcha Beating, Alibaba Tongyi Qianwen lanzó oficialmente la nueva base de agentes insignia de próxima generación Qwen3.7-Max. Los datos prácticos publicados oficialmente muestran que, sin ninguna documentación de arquitectura de chip ni datos de análisis de rendimiento, el nuevo modelo, en una tarea de optimización del kernel completamente autónoma que duró 35 horas y abarcó 1158 llamadas a herramientas, mejoró forzosamente en 10.0 veces el rendimiento del operador Triton del procesador nacional Pingtou Ge Zhenwu M890. Durante el proceso de optimización, el modelo pasó por cinco etapas centrales de evolución. Primero, mediante la partición Split-K, dividió el prefijo KV-cache a lo largo de la dimensión de tokens para llenar los 36 núcleos SM; luego, reemplazó el cudaMalloc síncrono entre host y dispositivo por variables PyTorch preasignadas, y mediante el uso de metadatos de tensor eliminó por completo la acción síncrona de cudaMemcpy al consultar la longitud del prefijo, eliminando así el costo de comunicación entre host y dispositivo; en la etapa final, el modelo reestructuró el operador para procesar simultáneamente los 4 tokens de consulta en un solo bloque de hilos, compartiendo la carga para distribuir el costo de acceso a memoria, completando una reestructuración clave a nivel de arquitectura. Las mediciones reales de optimización de operadores muestran que Qwen3.7-Max logró una aceleración geométrica media de 10.0x, superando significativamente a GLM 5.1 (7.3x) y Kimi K2.6 (5.0x). Mientras que DeepSeek V4 Pro solo alcanzó 3.3x y en la segunda mitad terminó la tarea de forma anticipada y activa debido a que no emitió ninguna llamada a herramienta durante cinco rondas consecutivas. Para dominar estrategias generales de resolución de problemas en entornos cambiantes, Qwen3.7-Max desacopló las tareas, los marcos de ejecución y los validadores durante el entrenamiento, y mediante entrenamiento de aprendizaje por refuerzo entre marcos evitó el sobreajuste de atajos específicos de benchmarks. En los benchmarks de agentes generales MCP-Mark (60.8 puntos) y SpreadSheetBench (87.0 puntos), Qwen3.7-Max mostró una gran capacidad de generalización, y su rendimiento integral se ha acercado al de Claude-4.6-Opus-Max. (Fuente: BlockBeats)
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado