DeepSeek V4 presenta por primera vez el sandbox de agente de nivel de producción DSec: programación de cientos de miles de concurrentes en un solo clúster, unificación de cuatro bases heterogéneas.

ME News, 24 de abril (UTC+8), según el monitoreo de Beating, el informe técnico de DeepSeek V4 reveló por primera vez la infraestructura central que respalda el entrenamiento posterior de Agent y la evaluación masiva: el sandbox de computación elástica de nivel de producción DSec (DeepSeek Elastic Compute). Actualmente, el aprendizaje por refuerzo de grandes modelos requiere un entorno de prueba y error de código extremadamente grande. El informe revela que, en la producción real, un solo clúster DSec puede programar cientos de miles de sandboxes concurrentes simultáneamente. El sistema está escrito en Rust, y la capa inferior se conecta al sistema de archivos distribuido 3FS desarrollado internamente, superando el cuello de botella de rendimiento del arranque en frío de una gran cantidad de sandboxes mediante la carga bajo demanda por niveles (on-demand loading). En cuanto a la experiencia del desarrollador, DSec unifica cuatro bases de ejecución (llamadas a funciones, contenedores, máquinas virtuales micro y máquinas virtuales completas) con un solo SDK de Python, y solo se necesita modificar un parámetro para cambiar entre ellas. Para el problema común de que las tareas sean interrumpidas en los clústeres de computación, DSec introduce un registro de trayectoria global: cuando se reanuda una tarea, el sistema "avanza rápidamente" reproduciendo los resultados de ejecución de comandos en caché, logrando una reanudación ultrarrápida del entrenamiento y evitando errores no idempotentes causados por la ejecución repetida. (Fuente: BlockBeats)
DEEPSEEK-2,53%
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado