Según Beating, Qwen3.7-Max ha sido lanzado oficialmente. Una tarea de optimización del núcleo completamente autónoma que duró 35 horas y realizó 1158 llamadas a herramientas, con una mejora de 10x en la implementación del operador Triton M890 de Pingtouge. La optimización en cinco etapas incluye división de caché Split-K, reemplazo de cudaMalloc con variables preasignadas, eliminación de consultas de prefijo y sincronización mediante metadatos tensor, y procesamiento paralelo de 4 tokens de consulta en un solo hilo de bloque para compartir cargas. Pruebas muestran una aceleración de 10x, superando a GLM5.1, Kimi K2.6, y DeepSeek V4 Pro, que solo alcanzó 3.3x y terminó sin llamadas a herramientas en etapas posteriores. Entrenamiento desacoplado de tareas/marcos/verificadores, aprendizaje por refuerzo entre marcos, con fuerte generalización en MCP-Mark y SpreadSheetBench, acercándose a Claude-4.6-Opus-Max.

BlockBeatNews

2026-05-20 03:36:50

Generación de resúmenes en curso

Según la monitorización de Beating, Alibaba Tongyi Qianwen ha lanzado oficialmente la nueva generación de base de agentes inteligentes, Qwen3.7-Max. Los datos de práctica publicados por la compañía muestran que, sin ningún documento de arquitectura de chip ni datos de análisis de rendimiento, el nuevo modelo logró mejorar en 10.0 veces el rendimiento del operador Triton en un tarea de optimización de núcleo completamente autónoma que duró 35 horas y realizó 1158 llamadas a herramientas.

Durante el proceso de optimización, el modelo pasó por cinco etapas clave de evolución. Primero, dividió el caché KV de prefijo mediante partición Split-K para llenar los 36 núcleos SM; luego, reemplazó la asignación cudaMalloc sincronizada entre la CPU y la GPU por variables preasignadas en PyTorch, y mediante el uso de metadatos de tensor eliminó completamente la acción de cudaMemcpy sincronizada al consultar la longitud del prefijo, eliminando por completo los costos de comunicación entre CPU y GPU; en la última etapa, el modelo reconstruyó los operadores para procesar simultáneamente los 4 tokens de consulta en un solo bloque de hilos, compartiendo la carga de acceso a memoria para distribuir los costos de acceso, logrando una reestructuración especializada a nivel arquitectónico.

Las pruebas de optimización de operadores mostraron que Qwen3.7-Max logró una aceleración media geométrica de 10.0x, superando notablemente a GLM 5.1 (7.3x) y Kimi K2.6 (5.0x). Mientras tanto, DeepSeek V4 Pro solo alcanzó 3.3x y en la segunda mitad del proceso terminó de forma anticipada debido a que no realizó ninguna llamada a herramientas en cinco rondas consecutivas.

Para dominar estrategias de resolución en entornos variables, Qwen3.7-Max desacopló tareas, marcos de ejecución y validadores durante el entrenamiento, y mediante aprendizaje reforzado entre marcos evitó sobreajustes a ciertos benchmarks específicos. En los benchmarks universales de agentes inteligentes MCP-Mark (60.8 puntos) y SpreadSheetBench (87.0 puntos), Qwen3.7-Max mostró una fuerte capacidad de generalización, alcanzando un rendimiento global que casi iguala a Claude-4.6-Opus-Max.

Ver original

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

Recompensa
Me gusta
Comentar
Republicar
Compartir

Comentar

Añadir un comentario

Sin comentarios

Temas de actualidad
Ver más
#
TradfiTradingChallenge
184.7K Popularidad
#
30YearTreasuryYieldBreaks5%
359.14K Popularidad
#
IsraelStrikesIranBTCPlunges
48.17K Popularidad
#
#DailyPolymarketHotspot
1M Popularidad
#
RWAMarketCapExceeds65Billion
8.75M Popularidad

Fijado

Qwen3.7-Max oficialmente lanzado: 1158 veces de escritura de código autónomo en 35 horas, y ha perfeccionado un operador de aceleración 10 veces más rápido en chips nacionales

Temas de actualidad

TradfiTradingChallenge

30YearTreasuryYieldBreaks5%

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

RWAMarketCapExceeds65Billion

Fijado