Step Star completamente de código abierto Step 3.5 Flash: Preentrenamiento + marco de entrenamiento totalmente liberados, alcanzando el Top 2 en OpenClaw

robot
Generación de resúmenes en curso

La startup china de grandes modelos de IA, Zejue Xingchen, después de lanzar el modelo abierto Step 3.5 Flash, ha publicado también los pesos preentrenados del modelo base y del modelo de entrenamiento medio (Midtrain), junto con el marco de entrenamiento Steptron. Según se informa, Step 3.5 Flash utiliza una arquitectura sparse MoE, con un total de 1960 millones de parámetros, pero durante la inferencia activa aproximadamente 110 millones de parámetros. En tareas de código con una sola solicitud, la velocidad de inferencia puede alcanzar hasta 350 TPS. Este modelo está diseñado específicamente para escenarios de agentes (Agent), mostrando un rendimiento sobresaliente en razonamiento complejo y tareas de cadenas largas. La compañía afirma que su profundidad de inferencia puede igualar a algunos modelos cerrados de nivel top. Hasta ahora, este modelo ha sido descargado más de 300,000 veces en Hugging Face y ocupa el primer lugar en las tendencias de OpenRouter. Además, en el conocido proyecto de código abierto OpenClaw (apodado “Cangrejo de río” por los usuarios chinos), el modelo ha subido al segundo lugar en popularidad. (Diario de la Junta de Innovación Científica y Tecnológica)

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado